Definição do nível de significância em função do tamanho amostral [thesis]

Melaine Cristina de Oliveira
Agradecimentos Agradeço à minha família pelo suporte emocional e financeiro, sem eles meu caminho seria muito mais difícil. Por me ensiarem a importância da educação e do aprendizado. Pelo amor, carinho e apoio incondicionais em todas as situações. Aos meus amigos pelo apoio e encorajamento, principalmente ao Victor Fossaluza pelo grande incentivo, discussões teóricas e carinho. Ao Marcelo Taddeo , Márcio Diniz e Pablo Andrade pela grande e valiosa ajuda computacional e paciência. Ao Vinícius
more » ... lsavara e Fábio Oki por todo o suporte, companheirismo e amizade, com diversas contribuições tanto na área acadêmica como pessoal. À Cláudia Nogueira e ao Pedro Cunha que me ajudaram a despertar o interesse necessário para o início desta jornada. Após convívio diário por 7 anos, certamente, levo uma parte de vocês comigo. Ao meu orientador, Prof. Carlinhos, genuinamente um grande mestre, pelo apoio, ensinamentos, desafios e bate-papos com direito a tapiocas às sextas-feiras. Agradeço por ter acreditado no meu trabalho e me guiar por esta jornada. i ii Resumo OLIVEIRA, M. C. Definição do nível de significância em função do tamanho amostral. 2014. 120 f. Tese (Mestrado) -Atualmente, ao testar hipóteses utiliza-se como convenção um valor fixo (normalmente 0,05) para o Erro Tipo I máximo aceitável (probabilidade de Rejeitar H 0 dado que ela é verdadeira) , também conhecido como nível de significância do teste de hipóteses proposto, representado por α. Na maioria das vezes nem se chega a calcular o Erro tipo II ou β (probabilidade de Aceitar H 0 dado que ela é falsa). Tampouco costuma-se questionar se o α adotado é razoável para o problema analizado ou mesmo para o tamanho amostral apresentado. Este texto visa levar à reflexão destas questões. Inclusive sugere que o nível de significância deve ser função do tamanho amostral. Ao invés de fixar-se um nível de significância único, sugerimos fixar a razão de gravidade entre os erros tipo I e tipo II baseado nas perdas incorridas em cada caso e assim, dado um tamanho amostral, definir o nível de significância ideal que minimiza a combinação linear dos erros de decisão. Mostraremos exemplos de hipóteses simples, compostas e precisas para a comparação de proporções, da forma mais convencionalmente utilizada comparada com a abordagem Bayesiana proposta. Palavras-chave: Teste de hipótese, nível de significância, tamanho amostral, combinação linear dos erros. iii iv Abstract OLIVEIRA, M. C. Setting the level of significance depending on the sample size. 2014. 120 f. Tese (Mestrado) -Paulo, 2014. Usually the significance level of the hypothesis test is fixed (typically 0.05) for the maximum acceptable Type I error (probability of Reject H 0 as it is true), also known as the significance level of the hypothesis test, represented here by α. Normally the type II error or β (probability of Accept H 0 as it is false) is not calculed. Nor often wonder whether the α adopted is reasonable for the problem or even analyzed for the sample size presented. This text aims to take the reflection of these issues. Even suggests that the significance level should be a function of the sample size. Instead of fix a unique level of significance, we suggest fixing the ratio of gravity between type I and type II errors based on losses incurred in each case and so, given a sample size, set the ideal level of significance that minimizes the linear combination of the decision errors. There are examples of simple, composite and sharp hypotheses for the comparison of proportions, the more conventionally used form compared with the Bayesian approach proposed.
doi:10.11606/d.45.2014.tde-23092014-160504 fatcat:6gxylr6eprhwlcitua5hf7mzjm