Influência local com procura \"forward\" em modelos de regressão linear [thesis]

Juan Pablo Mamani Bustamante
Agradecimentos Em primeiro lugar agradeço a Deus por me devolver a saúde e librar-me há muito tempo. A minha família, meu pai Feliciano Mamani, minha mãe Juana Bustamante e minha irmã Silvia por querer-me muito. A Professora Reiko Aoki, minha querida orientadora, por me entender e quem me ensino muitas coisas da estatística, pelas orientações na elaboração deste trabalho e também pela paciência, apoio e amizade durante todo o mestrado. Ao meu amigo Marcelo Hartmann, que ensino muitas coisas no
more » ... o muitas coisas no mestrado tanto da vida como no acadêmico, e pela amizade. Ao meu amigo Vinícius Siqueira, pela ajuda, piadas, risos e aguentar-me durante todo o mestrado. A minha querida amiga Marina Mitie Gishifu Osio quem foi quase como uma mãe na estadia no Brasil desde que a conheci, pela grande amizade e respeito. A minha querida amiga Cristel por compartilhar e trocar conhecimento, pelas piadas, alegrias e risos durante todo o mestrado. A minha querida amiga Lorena e a Miguel por ajudar-me e ensinar-me muitas vezes naqueles dias em que não entendi nada do que estava fazendo. Ao meu amigo Luciano porque se por ele não estaria aqui terminando os estudos porque ele foi um parceiro, amigo e meu camarada para vir a São Carlos. Aos meus amigos Efrain Candia e Sayda Chahuasonco porque eles foram como meus pais quando eu comecei trabalhar na universidade em Madre de Dios-Perú. Ao meu amigo Norbil e a Patricia por dar-me moradia muitas vezes em sua casa aqui em São Carlos. Aos meus caros amigos Thales Ricarte, Amélia Fernandes e John Garavito por compartilhar e trocar conhecimento, pelas ensinança da estatística e alegrias. Seria bom se eles mudassem mas esta bom como eles são. x Aos amigos Renato, Evandro, Victor, Felipe, Vanessa Rufino, Vanessa Masitéli, Arthur, Ricardo e Amanda,à turma da estatística, e a tantos outros que não mencionei aqui mas que me ajudaram de alguma forma no meu aprendizado. Aos professores que participaram da banca do exame de qualificação e/ou da defesa de mestrado: Cibele Maria Russo (ICMC-USP), Cristian Marcelo Villegas Lobos (ESALQ-USP) e Filidor Edilfonso Vilca Labra (UNICAMP), que muito contribuíram com as correções e sugestões desse trabalho. A todos os professores que contribuíram na minha formação e aos funcionários do (ICMC-USP) e (DEs-UFSCar). Agradeço aos amigos Jose (Trujillo) e Carlos (Puno) pela convivência que nós tivemos na republica. Agradeço aos amigos Carlos Franklin Taco, Jhon Bernedo, George Lucas e Paulo Seminario pelos jogos que compartilhamos. Agradeço a Maria Baldassari uma amiga espiritual quem estive no momento exato em que mais precisava de um conselho. Por ultimo agradeçoà todas as pessoas, amigos de longe e de perto, que contribuíram no desenvolvimento do trabalho. Resumo A identificação de observações influentes e/ou aberrantes de um conjunto de dadosé conhecida como uma parte das análises de diagnóstico. Esta técnica de diagnóstico têm como uma das finalidades verificar a robustez de um modelo estatístico, pois a não identificação dos dados influentes pode afetar a análise ou obter resultados incorretos. As metodologias comumente utilizadas para o diagnóstico de observações influentes em modelos de regressão são métodos de influência global (Belsey et al., 1980) . Cook (1986) introduziu um método geral para avaliar a influência local de pequenas perturbacões no modelo estatístico ou nos dados, usando diferentes tipos de perturbações. Como complementoàs técnicas de detecção de observações discrepantes,é proposto o método procura "forward", por Atkinson e Riani (2000) , queé uma metodologia para detectar observações atípicas mascaradas. Neste trabalho, propomos o uso da influência local com procura "forward" na obtenção de observações mascaradas influentes considerando modelos de regressão linear. Palavras-chave: Método de diagnóstico, modelo de regressão, influência local, gráfico de influência, curvatura normal, curvatura normal conformal, procura "forward". Abstract The identification of influential and/or atypical observations in a data set is known as a part of the diagnostic analysis. One of the purposes of the diagnostic analysis is to verify the robustness of a statistical model, as the non-identification of influential observations can affect the analysis or may cause the obtainment of incorrect results. The most commonly used methodology for the diagnostic of influential observations in regression models are the global influence (Belsey et al., 1980) . Cook (1986) introduced a general method to evaluate the local influence of small perturbations in the statistical model or in the data set using different perturbation schemes. As a complement to the techniques of detection atypical observations, it is proposed the forward search procedure by Atkinson e Riani (2000), which is a methodology to detect the masked atypical observations in a data set. In this work we propose the use of the local influence approach together with the forward search to obtain the masked influential observations in linear regression models.
doi:10.11606/d.104.2017.tde-19012017-112532 fatcat:xtrahe7n7rgwjdvm3g4eqaf7ci