Variables explicativas que no pueden controlarse ni fijarse: ¿Funciona la regresión?

Teresa Boca, Adriana Pérez, Susana Perelman
2020 Ecología Austral  
R������. El análisis de regresión lineal es una de las técnicas estadísticas que más se usan en los experimentos planificados para estudiar el funcionamiento de los sistemas naturales, en especial en estudios mensurativos. Muchas veces, el investigador no tiene capacidad de controlar la porción explicativa del modelo de regresión, por lo que las variables explicativas pueden resultar tan aleatorias o más que la variable respuesta. Esto podría generar sesgos en las estimaciones de las pendientes
more » ... s de las pendientes asociadas y conducir a conclusiones equivocadas. Una alternativa al método de regresión clásico es la regresión tipo II, diseñada para cuando no se pueden fijar los valores de la variable explicativa. En este trabajo se presentan distintas situaciones basadas en investigaciones publicadas en ecología y agronomía con diferentes objetivos: predicción, estimación de la pendiente y comparación de pendientes entre dos grupos, en las que el problema de variación aleatoria en las variables explicativas está presente con distinto grado de relevancia. En cada caso se identifica cuál es el camino más adecuado para el análisis. También se realizó una simulación que consideró distintas combinaciones para los errores aleatorios en las variables regresora y respuesta con el objetivo de visualizar el sesgo de los estimadores en cada situación para los diferentes métodos de regresión. De lo presentado se desprende que se debe poner énfasis en dos cuestiones muy importantes para poder decidir el método de regresión tipo II más adecuado: tener en claro cuál es el objetivo del trabajo y si se cumplen las condiciones de aplicación requeridos por cada método. Esta revisión pretende ser una sencilla guía de cuándo y qué método aplicar en cada situación. [Palabras clave: variables independientes con error, simulaciones, sesgo]. A�������. Explanatory variables that cannot be controlled or fixed: Does the regression work? Linear regression analysis is one of the most used statistical techniques in experiments planned to study the functioning of natural systems, especially in measurable studies. Many times, the researcher does not have the ability to control the explanatory portion of the regression model, so the explanatory variables can be as random or more than the response variable. This could generate biases in the estimates of the associated slopes and lead to wrong conclusions. An alternative to the classical regression method is type II regression when the values of the explanatory variable cannot be controlled. This paper presents different situations based on published research in ecology and agronomy for different purposes: prediction, estimate of the slope and comparison of slopes between two groups, in which the problem of random variation in the explanatory variables is present with different degrees of relevance. In each case, the most appropriate path for the analysis will be identified. A simulation was also carried out that considered different combinations for the random errors in the regressor and response variables in order to visualize the bias of the estimators in each situation for the different regression methods. It is clear from the foregoing that it is necessary to emphasize two very important issues in order to decide the most appropriate type II regression method: be clear about the objective of the work and if the application conditions required by each method are met. This review aims to be a simple guide to when and what method to apply in each situation.
doi:10.25260/ea.20.30.3.0.1066 fatcat:baelzth2mzeajkaadzlgvfiuke