DISTRIBUIÇÕES DISCRETAS

janeiro 06, 2025

DISTRIBUIÇÕES DISCRETAS

ME: Discrete Distributions.

Olá, Letícia da Minha Estatística aqui :). Click here to go to the post in English.

Essa semana, daremos uma pausa na nossa Série de Gráficos - se você tem acompanhado, sabe como tem sido uma jornada empolgante até agora! Para aqueles que são novos, sejam bem vindos! No post desta semana, vamos abordar um tópico igualmente fascinante: distribuições de probabilidade discretas!

Como você pode ou não saber, existem dois tipos de distribuições de probabilidade: distribuições discretas e contínuas. As distribuições discretas são caracterizadas por modelarem variáveis aleatórias que assumem um número finito ou contável de valores distintos. Essas distribuições são usadas quando os resultados possíveis de um experimento podem ser enumerados e contados, como o número de sucessos em uma sequência de tentativas ou o número de ocorrências de um evento dentro de um intervalo específico.

Ambas as distribuições, contínuas e discretas, têm suas funções de distribuição acumulada (FDA), que representam a probabilidade que uma variável aleatória tem de assumir um valor menor ou igual a um certo ponto, ou seja, \(F(a) = P(X \leq a)\), onde \(F(a)\) é a função de distribuição \(F\) de uma variável aleatória \(X\), com \( −∞ < a < +∞ \).

Para distribuições discretas, a função de distribuição \(F(x)\) possui três propriedades:

Se \(a \leq b\), então \(F(a) \leq F(b)\), ou seja, é não decrescente (monótona).
Como \(F(a)\) é uma probabilidade, o valor da função de distribuição está sempre limitado entre \(0\) e \(1\).
O valor da CDF imediatamente à direita de \(a\) se aproxima do valor da CDF em \(a\).

A terceira propriedade significa que, para uma variável aleatória discreta, a FDA é uma função de degraus e, entre esses pontos, o valor de \(F(x)\) se mantém constante. Por exemplo, se \(X\) pode tomar os valores 1, 2, 3 com probabilidades: \(P(X = 1) = 0.2\), \(P(X = 2) = 0.3\), \(P(X = 3) = 0.5\), a função de distribuição acumulativa aumenta em degraus em 1, 2 e 3. Podendo ser representada como:

\( F(x) = 0 \) para \( x < 1 \)
\( F(x) = 0.2 \) para \( 1 \leq x < 2 \)
\( F(x) = 0.5 \) para \( 2 \leq x < 3 \)
\( F(x) = 1.0 \) para \( x \geq 3 \)

A FDA é uma função em degraus que captura a probabilidade acumulativa até cada valor, \(F(a) = \sum p(a_i)\):

Em \( x = 1 \) \( F(1) = P(X \leq 1) = 0.2 \)
Em \( x = 2 \) \( F(2) = P(X \leq 2) = 0.2 + 0.3 = 0.5 \)
Em \( x = 3 \) \( F(3) = P(X \leq 3) = 0.2 + 0.3 + 0.5 = 1.0 \)

Isso mostra como as três propriedades de distribuições discretas funcionam, mais especificametente, como elas são não decrescentes, limitadas a ter resultados entre \(0\) e \(1\), e que a FDA aumenta em degraus, à medida que as probabilidades são acumuladas para cada valor possível de \(X\). A Função de Distribuição Acumulativa (FDA) nos ajuda a entender probabilidades acumulativas até um ponto específico.

Porém, há outro conceito fundamental a ser considerado: a Função Massa de Probabilidade (FMP). Ao contrário da FDA, que foca em probabilidades acumulativas, a FMP lida com resultados individuais, atribuindo probabilidades a cada valor específico de uma variável aleatória discreta. A Função Massa de Probabilidade (FMP) de uma variável aleatória \( X \) é uma função \( P(X = x) \) que dá a probabilidade de \( X \) assumir um valor específico \( x \). A FMP é expressa como:

\[ P(X = x) = p(x) \]

Onde:

\( X \) é a variável aleatória
\( x \) é um valor específico que \( X \) pode assumir
\( p(x) \) representa a probabilidade associada a \( x \)

É importante notar que a FMP se aplica apenas a distribuições discretas: para variáveis aleatórias contínuas, usamos a Função Densidade de Probabilidade (FDP) no lugar.

Agora que abordamos a FDA e a FMP, vamos abordar algumas das distribuições discretas mais comuns. Para cada distribuição, vamos analisar seu propósito, aplicação, FMP e fórmulas estatísticas chaves, incluindo a média e a variância.

Distribuição Uniforme

A distribuição discreta Uniforme é uma distribuição de probabilidade onde cada resultado possível \(k\) tem uma probabilidade igual de acontecer. É usada para modelar situações onde todos os resultados dentro de um quadro finito são igualmente possíveis. Seja \( X \) a variável aleatória representando o resultado de uma distribuição discreta Uniforme, com \( k \) valores possíveis, geralmente variando de \( 1 \) a \( k \) ou de \( a \) a \( b \).

Função Massa de Probabilidade (FMP): \( f(x) = \frac{1}{k} \quad (x = 1, 2, \dots, k)\) Média: \( E[X] = \frac{a + b}{2} \) Variância: \( \text{Var}(X) = \frac{(b - a + 1)^2 - 1}{12} \)

A distribuição discreta Uniforme é usada em várias aplicações onde todos os resultados dentro de um intervalo são igualmente possíveis, como acontece em jogos, por exemplo, jogar um dado, no embaralhamento de cartas e na geração de números aleatórios.

Distribuição Bernoulli

A distribuição Bernoulli é uma distribuição simples. Ela descreve um único experimento que tem apenas dois resultados possíveis: sucesso (1) ou falha (0), sendo útil nessas situações com resultados binários, como no lançamento de moedas.

Sendo \(X\) uma variável aleatória discreta que segue uma distribuição Bernoulli (\(X \sim \text{Ber}(p)\)) com parâmetros \(p\) onde \(0 \leq p \leq 1\) nós temos:

Função Massa de Probabilidade (FMP): \(f_{X}(1) = P(X = 1) = p\),
\(f_{X}(0) = P(X = 0) = 1 - p\), e
\(P(X = x) = p^x(1 - p)^{1 - x} \quad (x \in \{0, 1\})\) Média: \(E[X] = p\) Variância: \(\text{Var}(X) = p(1 - p)\)

A distribuição Bernoulli é um caso especial da distribuição Binomial quando \(n = 1\), como mostrado a seguir.

Distribuição Binomial

A distribuição Binomial é uma distribuição discreta que descreve o número de sucessos em um número fixo de experimentos de Bernoulli. Cada experimento tem dois resultados possíveis: sucesso (1) ou falha (0). É comumente usada para modelar situações como o número de caras em múltiplos lançamentos de moedas, ou o número de sucessos em uma série de experimentos.

Sendo uma variável aleatória discreta, \(X\) segue uma distribuição Binomial com parâmetros \(n\) (número de experimentos) e \(p\) (a probabiliadde de sucessos em um único experimento), escrito como \(X \sim \text{Bin}(n, p)\), com:

Função Massa de Probabilidade (FMP): \(P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k} \quad (k = 0, 1, 2, \dots, n)\) Média: \(E[X] = np\) Variância: \(\text{Var}(X) = np(1 - p)\)

A distribuição Binomial pode ser considerada como a soma de \(n\) experimentos de Bernoulli independentes, cada um com probabilidade de sucesso \(p\). Ela modela a probabilidade de obter exatamente \(k\) sucessos em \(n\) experimentos, onde cada experimento tem dois possíveis resultados (sucesso ou falha).

Distribuição de Poisson

A distribuição de Poisson é frequentemente usada para modelar o número de ocorrências de eventos raros dentro de um intervalo fixo de tempo ou espaço. Aplicações comuns incluem modelar eventos como a diminuição de radioatividade, acidentes de tráfego, ou o número de telefonemas em um call center. Esses eventos são tipicamente raros, acontecem independentemente e acontecem a uma taxa média constante.

Seja \(X\) uma variável aleatória que segue uma distribuição de Poisson com parâmetro \(\lambda\):

Função Massa de Probabilidade (FMP): \(f(x) = P(X = k) = e^{-\lambda}\frac{\lambda^x}{x!} \quad(x \geq 0)\) Média: \(E[X] = \lambda\) Variância: \(\text{Var}(X) = \lambda\)

A soma de duas variáveis independentes de Poisson também segue uma distribuição de Poisson com um parâmetro de taxa igual à soma dos parâmetros de taxa individuais., Isto é, se \(X_1\) é uma variável aleatória que segue uma distribuição de Poisson com o parâmetro de taxa \(\lambda_1\), e \(X_2\) é outra variável aleatória que segue uma dsitribuição de Poisson com parâmetro de taxa \(\lambda_2\), então \(X_1 + X_2 \sim \text{Poisson}(\lambda_1 + \lambda_2)\) (a soma dessas duas variáveis independentes de Poisson também vão seguir uma distribuição de Possion com parâmetro de taxa \(\lambda_1 + \lambda_2\)).

A distribuição de Poisson é útil em cenários como prever o número de clientes em uma loja, o número de acidentes em uma estrada, ou o número de e-mails recebidos em uma caixa de entrada, assumindo que os eventos acontecem de forma independente e a uma taxa constante.

Distribuição Geométrica

A distribuição Geométrica é uma distribuição discreta de probabilidade que modela o número de experimentos necessário para atingir o primeiro sucesso em uma sequência de experimentos independentes. É particularmente útil em situações onde estamos esperando o primeiro resultado bem-sucedido. Um estudo famoso na década de 80 usou a distribuição Geométrica para modelar o número de ciclos menstruais necessários para uma mulher engravidar depois de decidir tentar engravidar. Nesse caso, a distribuição mede o número de ciclos necessários para atingir o sucesso (engravidar), baseado em uma probabilidade fixa de concepção em cada ciclo.

Sendo uma variável aleatória discreta, \(X\) segue uma distribuição Geométrica \(X \sim \text{Geom}(p)\) com parâmetro \(p\) (a probabilidade de sucesso em um único experimento) e:

Função Massa de Probabilidade (FMP): \(P(X = k) = (1 - p)^{k-1} p \quad (k \geq 1)\) Média: \(E[X] = \frac{1}{p}\) Variância: \(\text{Var}(X) = \frac{1 - p}{p^2}\)

A distribuição geométrica modela o número de experimentos necessários para atingir o primeiro sucesso. Sua média é o inverso da probabilidade de sucesso em cada experimento. Ela é usada em situações da vida real, como prever o número de tentativas necessárias para obter um resultado positivo em processos. Um exemplo é o controle de qualidade, onde pode ajudar a determinar o número de experimentos (inspeções) necessários para detectar o primeiro defeito, permitindo que as empresas otimizem seus processos de inspeção e reduzam o desperdício.

Distribuição Negativa Binomial

A distribuição Negativa Binomial é usada para determinar o número de falhas que acontecem antes de atingir um número fixo de sucessos. Ela descreve o número de falhas \( F_r \) que ocorrem antes do \(r\)-ésimo sucesso em ensaios de Bernoull, onde a probabilidade de sucesso em cada experimento é \(p\) e \(n\) é o alcance, com:

Função Massa de Probabilidade (FMP): \( P(F_r = n) = P(T_r = n + r) = \binom{n + r - 1}{r - 1} p^r (1 - p)^n \quad(n = 0, 1, 2, \dots) \) \( T_r = F_r + r \) é o tempo de espera até o \( r \)-ésimo sucesso. Onde \( T_r \sim \text{NB}(r, p) \), com \( T_r \in \{r, r+1, \dots\} \). Média: \( E(F_r) = \frac{r(1 - p)}{p} \) Variância: \( \text{Var}(F_r) = \frac{r(1 - p)}{p^2}\)

A distribuição Negativa Binomial é especificamente útil para modelar o número de falhas que ocorrem antes de um número fixo de sucessos em uma série de experimentos independentes. Suas aplicações incluem controle de qualidade, esforços de vendas e outros processos onde o objetivo é alcançar um número determinado de sucessos, apesar da possibilidade de falhas ao longo do caminho.

Depos de discutir todas as principais distribuições discretas e suas aplicações, é importante resumir suas características chave das distribuições que abordamos. Abaixo está uma tabelaque destaca resumidamente cada distribuição, juntamente com sua aplicação típica, função de massa de probabilidade (FMP), média e variância. Esta tabela serve como um guia rápido de referência para ajudá-lo a entender melhor as características únicas de cada distribuição e como elas podem ser aplicadas a vários cenários do mundo real.

Conclusão

Nesta discussão sobre as distribuições discretas principais, exploramos uma variedade de modelos de probabilidade que são essenciais para entender diferentes tipos de processos aleatórios. Cada distribuição tem um propósito único e pode ser aplicada a situações específicas do mundo real:

A distribuição Uniforme modela situações onde todos os resultados têm a mesma probabilidade de ocorrer. As distribuições de Bernoulli e Binomial são úteis para modelar resultados binários e o número de sucessos em tentativas repetidas, respectivamente. A distribuição Geométrica é benéfica quando se modela o número de tentativas necessárias para o primeiro sucesso, enquanto a distribuição de Poisson é frequentemente aplicada a eventos raros que ocorrem dentro de intervalos fixos. Finalmente, a distribuição Binomial Negativa estende a ideia da distribuição Geométrica para modelar falhas antes de atingir um número fixo de sucessos.

Essas distribuições discretas são ferramentas fundamentais em áreas como controle de qualidade, marketing, saúde e muitas outras. Suas aplicações oferecem insights sobre vários fenômenos que envolvem incerteza, e entender suas características ajuda a escolher a distribuição apropriada para analisar dados e fazer previsões. O domínio dessas distribuições é essencial para qualquer pessoa que trabalhe com estatística, análise de dados ou teoria da probabilidade.

Obrigado por explorar esses modelos de probabilidade comigo! Espero que essas informações o ajudem na aplicação desses conceitos em situações práticas!

Estamos também no Instagram @minhaestatistica, espero vê-lo lá e até a próxima semana,

Letícia - Minha Estatística.

Referências

Pitman, J. (1993). Probability. Springer.
Wasserman, L. (2003). All of Statistics: A Concise Course in Statistical Inference. Springer.
Dekking, F.M., Kraaikamp,C., Lopuhaä,H.P. & Meester, L.E. (2005). A Modern Introduction to Probability and Statistics: Understanding Why and How. Springer.
Heumann, C., Schomaker, M. (2016). Introduction to Statistics and Data Analysis: With Exercises, Solutions, and Applications in R. Springer.

Pesquisar este blog

MINHA ESTATÍSTICA

DISTRIBUIÇÕES DISCRETAS

Distribuição Uniforme

Distribuição Bernoulli

Distribuição Binomial

Distribuição de Poisson

Distribuição Geométrica

Distribuição Negativa Binomial

Conclusão

Referências

Comentários

Postar um comentário

Postagens mais visitadas

DENDOGRAMAS: SÉRIE DE GRÁFICOS

ETL in Data Warehousing