Amplamente utilizada na vida cotidiana, a palavra probabilidade não tem uma definição simples. A probabilidade matemática relaciona-se com o acaso, uma noção com raízes profundas na antiguidade, encontrada nas obras de filósofos e poetas, refletida em jogos de azar generalizados e na prática do sortilégio, resolvendo a incerteza pelo lançamento de sorteios. A teoria matemática da probabilidade, o estudo das leis que governam a variação aleatória, originou-se no século XVII e tornou-se um ramo vigoroso da matemática moderna. Como base da inferência estatística, transformou a ciência e está na base de grande parte da tecnologia moderna. Ela exerceu influência significativa na ética e na política, embora nem sempre com plena apreciação de suas forças ou limitações.
Milhares de cientistas, engenheiros, economistas e outros profissionais usam os métodos de probabilidade matemática e estatística em seu trabalho, auxiliados por pacotes de software de computador prontamente disponíveis. Mas não há um forte consenso sobre a natureza do acaso no universo, nem sobre a melhor maneira de fazer inferências a partir da probabilidade, de modo que o assunto continua a ser de interesse vivo para os filósofos. Também faz parte da experiência diária – o clima, as condições de tráfego, os esportes, a loteria, o mercado de ações, seguros, para citar apenas alguns – sobre os quais todos têm opiniões.
O uso da probabilidade matemática em ciência e tecnologia é muitas vezes bastante técnico, envolvendo modelos elaborados e matemática avançada que estão além do entendimento dos não-especialistas. Controvérsias de alto nível podem depender da simplificação excessiva dos defensores e da mídia, de vieses inexplorados ou da falta de apreciação do grau de incerteza nos resultados científicos. Contudo, as decisões políticas baseadas em tais evidências erradas podem ter consequências econômicas e sociais de longo alcance. A consciência do papel da probabilidade é, portanto, essencial para julgar a qualidade da evidência empírica, e isso implica uma responsabilidade moral para os cidadãos de uma sociedade democrática.
Embora muitas técnicas diferentes da teoria da probabilidade estejam agora em uso, todas compartilham um conjunto de conceitos básicos. É possível expressar esses conceitos sem matemática avançada, mas os conceitos em si são profundos e os resultados muitas vezes contraintuitivos. O insight pode, portanto, exigir ponderação persistente. Esta entrada apresenta os conceitos básicos de forma concisa, usando apenas matemática elementar. Mais detalhes e muitas aplicações são encontradas em uma ampla gama de livros didáticos introdutórios, escritos em vários níveis de abstração matemática.
Aplicações de Experimentos de Probabilidade Simples
O ingrediente fundamental da teoria da probabilidade é uma experiência que pode ser repetida, pelo menos hipoteticamente, sob condições essencialmente idênticas e que podem levar a diferentes resultados em diferentes tentativas. O conjunto de todos os resultados possíveis de um experimento é chamado de “espaço amostral”. O experimento de jogar uma moeda uma vez resulta em um espaço amostral com dois resultados possíveis, “cara” e “coroa”.
O dado tem um espaço amostral com 36 resultados possíveis, cada um dos quais pode ser identificado com um par ordenado ( i , j ), onde ie j assumem um dos valores 1, 2, 3, 4, 5, 6 e denotam os rostos mostrando nos dados individuais. É importante pensar nos dados como identificáveis (digamos, por uma diferença de cor), de modo que o resultado (1, 2) seja diferente de (2, 1). Um “evento” é um subconjunto bem definido do espaço de amostra. Por exemplo, o evento “a soma dos rostos mostrando os dois dados é igual a seis” consiste nos cinco resultados (1, 5), (2, 4), (3, 3), (4, 2) e (5, 1) .
Um terceiro exemplo é desenhar n bolas de uma urna contendo bolas de várias cores. Um resultado genérico para este experimento é um n- número, onde a entrada i especifica a cor da bola obtida no i sorteio ( i = 1, 2,…, n ). Apesar da simplicidade deste experimento, um entendimento completo fornece a base teórica para pesquisas de opinião e pesquisas por amostragem. Por exemplo, indivíduos de uma população a favor de um determinado candidato em uma eleição podem ser identificados com bolas de uma determinada cor, os que favorecem um candidato diferente podem ser identificados com uma cor diferente e assim por diante. A teoria da probabilidade fornece a base para aprender sobre o conteúdo da urna a partir da amostra de bolas retiradas da urna; Uma aplicação é aprender sobre as preferências eleitorais de uma população com base em uma amostra extraída dessa população.
Outra aplicação de modelos de urna simples é usar ensaios clínicos projetados para determinar se um novo tratamento para uma doença, um novo medicamento ou um novo procedimento cirúrgico é melhor do que um tratamento padrão. No caso simples em que o tratamento pode ser considerado como sucesso ou fracasso, o objetivo do ensaio clínico é descobrir se o novo tratamento conduz mais frequentemente ao sucesso do que o tratamento padrão. Pacientes com a doença podem ser identificados com bolas em uma urna. As bolas vermelhas são aqueles pacientes que são curados pelo novo tratamento, e as bolas pretas são aquelas que não são curadas. Geralmente há um grupo de controle, que recebem o tratamento padrão. Eles são representados por uma segunda urna com uma fração possivelmente diferente de bolas vermelhas.
O objetivo do experimento de desenhar um certo número de bolas de cada urna é descobrir, com base na amostra, que a urna tem a maior fração de bolas vermelhas. Uma variação dessa ideia pode ser usada para testar a eficácia de uma nova vacina. Talvez o maior e mais famoso exemplo foi o teste da vacina Salk para poliomielite realizado em 1954. Foi organizado pelo Serviço de Saúde Pública dos EUA e envolveu quase dois milhões de crianças. Seu sucesso levou à quase completa eliminação da poliomielite como um problema de saúde nas partes industrializadas do mundo. Estritamente falando, essas aplicações são problemas de estatística, para os quais as fundações são fornecidas pela teoria da probabilidade.
Em contraste com os experimentos descritos acima, muitos experimentos têm infinitos resultados possíveis. Por exemplo, pode-se jogar uma moeda até que “cara” apareça pela primeira vez. O número de lançamentos possíveis é n = 1, 2,…. Outro exemplo é girar um spinner. Para um spinner idealizado feito de uma linha retasegmento sem largura e girado em seu centro, o conjunto de resultados possíveis é o conjunto de todos os ângulos que a posição final do spinner faz com alguma direção fixa, equivalentemente todos os números reais em [0, 2π). Muitas medições nas ciências naturais e sociais, como volume, voltagem, temperatura, tempo de reação, renda marginal e assim por diante, são feitas em escalas contínuas e, pelo menos em teoria, envolvem infinitamente muitos valores possíveis. Se as medidas repetidas em diferentes disciplinas ou em momentos diferentes sobre o mesmo assunto podem levar a resultados diferentes, a teoria da probabilidade é uma ferramenta possível para estudar essa variabilidade.
Devido à sua simplicidade comparativa, os experimentos com espaços amostrais finitos são discutidos primeiro. No desenvolvimento inicial da teoria da probabilidade, os matemáticos consideravam apenas os experimentos para os quais parecia razoável, baseado em considerações de simetria, supor que todos os resultados do experimento eram “igualmente prováveis”. Então, em um grande número de experimentos todos os resultados deveriam ocorrer. com aproximadamente a mesma frequência.
A probabilidade de um evento é definida como a razão do número de casos favoráveis ao evento – ou seja, o número de resultados no subconjunto do espaço de amostra que define o evento – para o número total de casos. Assim, os 36 resultados possíveis no lançamento de dois dados são considerados igualmente prováveis, e a probabilidade de obter “seis” é o número de casos favoráveis, 5, dividido por 36 ou 5/36.
Agora, suponha que uma moeda é lançada n vezes, e considerar a probabilidade do evento “cabeças não ocorre” nos n lançamentos. Um resultado do experimento é um n- númeo, cuja k- ésima entrada identifica o resultado do k lance. Como há dois resultados possíveis para cada lance, o número de elementos no espaço de amostra é 2 n . Destes, apenas um resultado corresponde a não ter cabeças, então a probabilidade requerida é de 1/2 n .
É apenas um pouco mais difícil determinar a probabilidade de “no máximo uma cabeça”. Além do único caso em que nenhuma cabeça ocorre, há n casos em que exatamente uma cabeça ocorre, porque pode ocorrer na primeira, segunda ,… Ou n th toss. Portanto, há n + 1 casos favoráveis para obter no máximo uma cabeça, e a probabilidade desejada é ( n + 1) / 2 n .