class: center, middle, inverse, title-slide # Jurimetria ## aplicações efetivas e potenciais, técnicas aplicáveis e ferramentas disponíveis ### José de Jesus Filho ### 07/10/2021 --- layout: true <div class="my-footer"><span> <a href="https://www.github.com/jjesusfilho">Github</a> | <a href="https://linkedin.com/jjesusfilho">Linkedin</a> | <a href="http://jurimetria.consudata.com.br">Curso jurimetria</a> | <a href="http://rpsql.consudata.com.br">Ciência de Dados com R e PostgreSQL</a> | </span></div> --- class: center Suponha que você queira descobrir qual a chance de obter uma decisão favorável em um pedido. Você faz uma busca de 100 decisões com a mesma causa de pedir e descobre que 63 delas foram favoráveis e 37 desfavoráveis. Desconfiado de que 100 decisões não são suficientes para uma boa apreciação das chances, você faz uma nova busca com 1000 decisões e descobre que foram 670 decisões favoráveis e 330 desfavoráveis. --- class: center Colocando essa situação em probabilidade, você teria para o primeiro caso: $$ P(D = f) = 63/100 = 0,63 $$ Desfavoráveis: $$ P(D = d) = 37/100 = 0,37 $$ Favoráveis para a segunda amostra: $$ P(D = f) = 670/1000 = 0,67 $$ Desfavoráveis para a segunda amostra: $$ P(D = d) = 330/1000 = 0,33 $$ --- class: center A diferenca entre a primeira amostra e a segunda é simplesmente que, embora as probabilidades não tenham mudado muito, na segunda, a incerteza é menor. Isso porque o valor da amostra (n) é maior. A jurimetria dedica-se a aplicar métodos quantitativos a fim de reduzir a incerteza acerca de eventos futuros. Note que a incerteza não desaparecerá, mas ela será aferida numericamente. A jurimetria não substitui o trabalho da(o) jurista, mas fornece meios para que ela ou ele tome decisões baseadas em dados e não somente com base em prática forense ou na leitura da doutrina. --- Suponha agora que, sabendo dessa probabilidade, você distribui três ações e quer saber a probabilidade de que o desfecho processual seja favorável em duas delas. Para visualizar este cenário, vamos construir uma árvore de probabilidades. --- # Árvore de probabilidades
--- class::center # Generalizando No final das contas, o que temos é: $$ P_2 = 3\times0,67^2\times0,33^1 = 0.444411$$ Podemos generalizar esse cálculo da seguinte forma: $$ P_k = \binom{n}{k}\times p^k \times (1-p)^{n-k}$$ --- class: center # Explicando Para saber qual a probabilidade de duas ações favoráveis, nós basicamente multiplicamos a probabilidade do evento de interesse (favorável) por ela mesma duas vezes, k vezes, e o resultado multiplicamos pela probabilidade do evento contrário (desfavorável) uma vez (n-k), sendo que n é o número de distribuições e k o número de eventos de interesse. Além disso, temos de multiplicar essa probabilidade resultante pelo número de possíveis combinações desse mesmo cenário, ou seja, dois resultados favoráveis de três ações distribuídas, sendo que a ordem não importa. --- class: left # Jurimetria Jurimetria é a ciência de dados aplicada ao direito. Por meio dela, é possível coletar, organizar, armazenar e analisar dados. A jurimetria utiliza de uma ampla gama de técnicas, métodos e ferramentas para realizar seu trabalho. Ela está na intersecção de três conhecimentos: 1. Direito 2. Programação 3. Estatística e machine learning --- class: left # Direito O conhecimento substantivo do Direito é fundamental para elaborar perguntas apropriadas, levantar hipóteses e delimitar o escopo de um projeto. Há muitos ramos no direito e, dentro desses ramos, muitos assuntos: 1. Direito civil 2. Direito penal 3. Direito tributário 4. Direito previdenciário 5. Direito do Trabalho 7. Direito administrativo 8. Direito constitucional --- class: left # Programação Conhecer uma linguagem de programação voltada à ciência de dados, especialmente R e Python, permite coletar, tratar e analisar os dados jurídicos. Além disso, o domínio de um sistema de administração de banco de dados, seja SQL ou noSQL, permite o armazenamento eficiente dos dados coletados e analisados. Por fim, há uma série de técnicas voltadas à extração e análise de texto, tais como NLP e expressões regulares. --- class: left # Estatística e Machine Learning O domínio da estatística e de machine learning parmite realizar análises inferenciais e preditivas acerca da prática do Direito. Exemplos: 1. Qual a probabilidade de uma decisão judicial ser favorável ou desfavorável? 2. Qual a sobrevida de um processo? Isto é, qual o tempo esperado para que um processo seja julgado? Quais os fatores que influenciam o retardamento do trâmite processual? 3. Quais cláusulas são indispensáveis num contrato? --- # Ciclo jurimétrico 1. Desenho do projeto; 2. operacionalização em variáveis mensuráveis; 3. análise de viabilidade; 4. coleta; 5. limpeza e organização dos dados; 6. transformação dos dados; 7. análise exploratória; 8. análise inferencial e preditiva; 9. métricas de desempenho; 10. publicação dos resultados. Irei explorar as três primeiras fases. --- class: left # Desenho do projeto 1. O que pretendo responder? 2. Quais dados preciso para responder a esta pergunta? ### Exemplos 1. Qual o tempo médio para a apreciação de uma liminar em pedido de despejo? 2. As câmaras de direito público favorecem mais o contribuinte ou a Fazenda em execução fiscal? 3. A quantidade e o tipo de droga influenciam o desfecho processual no sentido de condenar por tráfico ou por porte? 4. Decisões monocráticas são mais relevantes que decisões colegiadas no STF? --- class: left # Análise de viabilidade A análise de viabilidade busca responder a três perguntas básicas: 1. Os dados existem? 2. Se existem, são acessíveis? 3. Se são acessíveis, qual a qualidade desses dados? --- class: left # Dificuldades 1. Classificar textos é muito mais complexo do que classificar imagens e áudios; 2. a lógica do processo físico foi transportada para o processo eletrônico; 3. há muito de encantamento sobre os potenciais da inteligência artificial aplicada ao direito; 4. há uma diversidades de sistemas de processamento e pouca padronização; 5. o Judiciário avançou, mas os os demais órgãos do sistema de justiça ainda não avançaram; 6. os dados ainda são produzidos seguindo uma lógica do consumo interno. --- class: left # Desafios 1. Peças processuais, e.g., petições e decisões, deveriam superar a estrutura própria do processo físico; 2. os tribunais deveriam abrir os dados em forma de API; 3. a uniformização e a padronização iniciadas pelo CNJ deveriam ser melhor implementadas e respeitadas pelos tribunais; 4. promover auditorias para melhorar a qualidade dos dados; --- class: left # Consumidores/fornecedores de dados 1. Público; 2. advogados; 3. magistrados; 4. servidores;