Este artículo describe un modelo desarrollado para apoyar las decisiones de inversión en una red de estaciones de servicio. El modelo determina el potencial de ventas de las estaciones de servicio en las principales ciudades de Brasil como Río de Janeiro, São Paulo y Recife. Utiliza variables explicativas como la densidad del tráfico, el número de competidores, el número promedio de bombas por competidor y la velocidad en las vías de paso. Se utilizaron análisis de regresión no lineal para desarrollar el modelo, con algunos resultados presentados aquí.
1. INTRODUCCIÓN
Este artículo presenta un modelo para evaluar el potencial de ventas en gasolineras urbanas, con miras a decidir abrir una nueva unidad, monitorear el volumen de ventas de una unidad existente o analizar la sensibilidad de los factores que más influyen en el potencial de ventas de una estación. . El modelo desarrollado es una regresión no lineal múltiple tomando en cuenta variables como volumen de tráfico, área de instalación y nivel de competencia en las cercanías de la gasolinera.
Para las empresas de distribución de combustible que operan en Brasil, la red de estaciones de servicio es el corazón de su negocio y su mayor fuente de ingresos. Por otro lado, una gasolinera es una inversión de cientos de miles de dólares, que abarca no solo su instalación, sino también su operación continua. De esta forma, el estudio se justifica porque, a partir de la determinación del potencial de ventas inherente al lugar, es posible estimar el Retorno de la Inversión (ROI) para una determinada configuración operativa y grado de competencia en el mercado, con el fin de para evaluar la viabilidad del futuro puesto.
También es posible, para una determinada estación existente, comparar su potencial de ventas con su desempeño actual, utilizando el modelo como herramienta de gestión para controlar, mejorar y capacitar a sus operadores. En cualquier caso, la complejidad inherente a las decisiones de apertura de gasolineras es un campo fértil para la aplicación de varias técnicas de modelado en el desarrollo de sistemas de apoyo a la decisión. Además de una breve revisión bibliográfica, en los siguientes apartados detallaremos las variables consideradas, los análisis desarrollados y los resultados obtenidos.
2. REVISIÓN DE LA LITERATURA
Hay pocos estudios de esta naturaleza disponibles en la literatura. El trabajo de DIXON (1995) desarrollado en Sudáfrica es el más cercano a la línea desarrollada en este artículo. Su estudio se basó en una muestra de varias gasolineras urbanas ubicadas en Ciudad del Cabo, Durban y Gauteng, con el objetivo principal de determinar su potencial de ventas.
Inicialmente se probaron 100 variables explicativas, entre ellas número de boquillas, señales de tránsito, volumen de tránsito, acceso, área y apariencia de las instalaciones. Después de algunas pruebas, DIXON (1995) llegó a un modelo no lineal compuesto por 30 variables explicativas. El poder explicativo de este modelo puede considerarse bueno, siendo el R2 ajustado del 80 %, 72 % y 71 % para Durban, Ciudad del Cabo y Gauteng, respectivamente. El autor también muestra que el uso de términos cuadráticos en el modelo mejora sustancialmente su poder explicativo. Finalmente, FERNANDES et al. (1997) desarrollaron un modelo para pronosticar las ventas de combustible en estaciones ubicadas a lo largo de las carreteras. La fórmula adoptada para explicar las ventas agregadas de combustibles (mercado potencial) en un área determinada fue la siguiente:
![]() |
donde V es la suma de las ventas de todas las estaciones de la zona, X1 es la suma de las zonas y X2. es el número de habitantes de la zona. El poder explicativo de este modelo es alto, con un R2 Ajustado del 94,9% por el potencial de la zona. Posteriormente, los autores utilizaron modelos gravitacionales para analizar las ventas individuales de cada gasolinera.
3. CARACTERÍSTICAS DE LA MUESTRA Y VARIABLES CONSIDERADAS
A lo largo de 1996, se recopilaron datos de 95 estaciones de servicio en los principales centros urbanos brasileños, como Río de Janeiro, São Paulo, Belo Horizonte y Recife. La elección exclusiva de las estaciones de servicio urbanas se debió a que, en Brasil, las estaciones de servicio del interior tienen su volumen de ventas determinado, sobre todo, por el grado de empatía y cordialidad en el servicio. Parece que, a diferencia de las gasolineras urbanas, existe una relación de fidelización entre la gasolinera y sus clientes de las zonas rurales, que también es un sector difícil de cuantificar. La Tabla 1 describe las variables explicativas y la variable dependiente consideradas en el modelo. La Tabla 2 contiene un resumen con estadísticos descriptivos para cada variable.
![]() |
La siguiente sección describe el análisis inicial realizado en los datos recopilados.
4. ANÁLISIS PRELIMINAR: REGRESIÓN LINEAL MÚLTIPLE
Una vez definidas las principales variables explicativas y el comportamiento de sus respectivas señales, el siguiente paso consistió en el análisis residual del siguiente modelo lineal múltiple:
![]() |
Este modelo tenía un poder explicativo muy bajo (R2 ajustado = 40%) además de un error estándar muy alto, alrededor de 131 m3/mes. Sin embargo, como era de esperar, las variables TRÁFICO (T), HORAS (H) y BOQUILLAS PROMEDIO POR COMPETIDOR (B) presentaron contribuciones positivas al Volumen de Ventas (VV), mientras que la suma de estaciones competidoras (P) y la velocidad (V) presentaron contribuciones negativas. contribuciones.
Entre los objetivos del análisis residual en el modelo lineal múltiple, destacamos la exploración de la existencia o no de multicolinealidad entre las variables explicativas, la identificación de outliers y observaciones con coeficientes de apalancamiento elevados (h). También se analizaron las distancias de Cook de cada una de las observaciones en relación con las demás, así como la condición de homocedasticidad y normalidad de los residuos.
Un punto con alto apalancamiento es una observación que contiene un conjunto inusual de valores para las variables explicativas, capaz de ejercer una fuerte influencia en el resultado (coeficientes) de la regresión debido a su efecto desproporcionado (apalancado) en comparación con las otras observaciones. .
![]() |
Con una sola variable explicativa, la determinación de observaciones inusuales se realiza analizando el histograma de la variable explicativa. Cuando se trabaja con más de dos variables explicativas, es mucho más complejo determinar gráficamente si un punto es poco común. Por ejemplo, en la figura 1 entre dos variables explicativas (x1 y x2), el punto marcado en la esquina superior derecha es inusual, alejado de la gran nube de observaciones. Sin embargo, analizando los histogramas de x1 y x2 por separado, esta diferencia no se nota. El análisis de los coeficientes de apalancamiento (h) es una herramienta muy útil para identificar observaciones como la mencionada anteriormente. Valores altos de h indican que una observación está teniendo un impacto desproporcionado en los coeficientes de regresión. En general, podemos considerar puntos de alto apalancamiento, aquellos que satisfacen la relación:
![]() |
La distancia de Cook, a su vez, es un estadístico que se utiliza para cuantificar cuán inusual es una observación, teniendo en cuenta no solo las variables explicativas (como es el caso de los coeficientes de apalancamiento), sino también sus residuos. El cálculo del valor crítico de la distancia de Cook viene dado por la fórmula:
![]() |
En total, se identificaron 15 observaciones con alto coeficiente de apalancamiento y alta distancia de Cook, las cuales fueron removidas de la muestra para el análisis definitivo de los datos, lo que implicó el uso de técnicas de regresión múltiple no lineal.
5. ANÁLISIS FINAL: REGRESIÓN MÚLTIPLE NO LINEAL
Entre los diversos modelos no lineales probados, el que mostró la mejor capacidad de respuesta (medida por un error residual cuadrático más pequeño y un coeficiente R2 ajustado más alto) fue el siguiente:
![]() |
Sin embargo, la heterocedasticidad verificada en los residuales condujo a la división de la muestra de 80 observaciones (95 iniciales excluyendo las 15 observaciones con coeficientes de apalancamiento y distancias de Cook altos) en dos muestras de tamaños similares, según diferentes criterios probados. Entre estos, el criterio que más incrementó el poder explicativo del modelo para las dos submuestras fue la variable velocidad (V). Las observaciones con valores de velocidad superiores a 40 km/h se agruparon en una muestra (carreteras de alta velocidad) y las observaciones con valores de velocidad inferiores o iguales a 40 km/h (carreteras de baja velocidad) se agruparon en otra. Debemos recordar que la mediana de la variable velocidad es 40 km/h.
Para la submuestra con V<=40 km/h, el modelo mostró un poder explicativo muy alto (R2 Ajustado = 80%) además de que el promedio de los residuales fue bastante razonable, alrededor de 51 m3/mes. Aún como se esperaba, las variables TRÁFICO (T), HORAS (H) y BOQUILLAS PROMEDIO POR COMPETIDOR (B) presentaron contribuciones positivas al Volumen de Ventas (VV), mientras que la suma de estaciones competidoras (P) y velocidad (V) presentaron contribuciones negativas. .
En cuanto a la submuestra con V>40 km/h, el modelo también mostró un poder explicativo muy alto (R2 Ajustado = 76%) además de que el promedio de los residuos fue bastante razonable, alrededor de 52 m3/mes. Aún como se esperaba, las variables TRÁFICO (T), HORAS (H) y BOQUILLAS PROMEDIO POR COMPETIDOR (B) presentaron contribuciones positivas al Volumen de Ventas (VV), mientras que la suma de estaciones competidoras (P) y velocidad (V) presentaron contribuciones negativas. . De acuerdo con los gráficos 1 y 2, que muestran los residuos versus el volumen de ventas para las dos submuestras, es posible observar que no se observa heterocedasticidad.
![]() |
- CONCLUSIÓNEl modelo desarrollado está siendo utilizado actualmente por la empresa distribuidora de combustible propietaria de las 95 estaciones donde se recogieron las observaciones. La facilidad de operación proporcionada por el uso de hojas de cálculo electrónicas (por ejemplo, la hoja de cálculo EXCEL ® ) permitió que el personal de campo utilizara este modelo para decidir si abrir o no una nueva estación de servicio. Uno de los factores que contribuyeron a la aceptación del modelo fue el hecho de que no existía un término constante; así, cuando todas las variables explicativas son cero, el volumen de ventas (VV) estimado para la gasolinera también es cero Los desarrollos futuros de este modelo están directamente relacionados con su segmentación por centros urbanos, con el fin de considerar las características particulares de cada ciudad en cuanto a perfil de flota, ingreso promedio, patrón de tráfico, posturas regulatorias municipales, etc. Existen claras diferencias estructurales entre los diversos centros urbanos brasileños que seguramente aumentarán el poder explicativo del modelo en el futuro.
8. BIBLIOGRAFÍA
DIXON, CE, 1995; “La Gestión de una Red de Estaciones de Servicio”; Programas de Servicios de Apoyo a la Decisión – Servicios de Información CSIR, Pretoria, Sudáfrica.
FERNANDES, C., THEMIDO, I., 1997; “Modelado de Ventas de Combustibles Líquidos Utilizando Modelos Gravitacionales”; Investigación Operacional, v.17, n.1, junio, pp. 41-60.
LIBRES, EW, 1996; Análisis de datos mediante modelos de regresión: la perspectiva empresarial. 1 edición Nueva Jersey, Prentice Hall Internacional.