Revenir à l'accueil

mots-clefs: mobilités domicile-travail, modèle gravitaire, flux dominants

Ce projet repose sur un document computationnel dynamique et s'adapte automatiquement au département que l'on souhaite étudier.

La principale loi qui régit les échanges dans l’espace géographique s’exprime de la façon suivante: les échanges entre lieux sont proportionnels aux masses de ces lieux et inversement proportionnels à la distance qui les sépare. Le modèle gravitaire, formalisation mathématique de cette loi, fournit un puissant outil pour étudier les interactions spatiales.

Ce projet vise à expérimenter comment ce concept clef de l’analyse spatiale peut être mobilisé pour appréhender les mobilités domicile-travail de commune à commune à l'échelle d'un département. Il s’agit notamment de voir de manière empirique l’influence de paramètres comme la résistance à la distance sur la qualité des prédictions du modèle grâce à des indicateurs quantitatif (mesure des résidus) et qualitatif (capacité du modèle à restituer les principales zones d’influence).

Méthodologie

L’analyse spatiale s’appuie sur une unique source de données: la base flux de mobilité du recensement de la population de 2016 (déplacements domicile-lieu de travail) et a été menée en quatre étapes principales.

Tout d’abord, quelques indicateurs synthétiques ont été calculés pour appréhender de manière globale la répartition des actifs et des emplois au sein du département.

Dans un second temps, une analyse des flux dominants selon la méthodologie proposée par Nystuen et Dacey a été réalisée. Celle-ci a permis d’échelonner les communes selon une hiérarchie simple à trois niveaux principaux: villes dominantes, villes relais et communes dominées et de définir différents bassins d’attractivité.

Troisièmement, quatre variantes d'un modèle gravitaire portant sur la fraction des flux à destination des villes dominantes et relais a été calibré. Le modèle standard présente la quantité d’actifs Fij habitant une commune i et travaillant dans une ville dominante et relais j selon une formule: Fij = k Mi Mj dij -a comprenant trois variables:

  • Mi : le nombre d’actifs résidant la commune et travaillant dans une des villes dominantes ou relais (autre que celle de résidence) pour chaque commune;
  • Mj : le nombre total de ces actifs travaillant dans chacune des villes dominantes ou relais;
  • dij -a : la distance de Manhattan séparant les centroïdes de chaque commune aux centroïdes de chaque ville dominante ou relais;

et deux paramètres : k représentant le taux de mobilité et a exprimant la résistance à la distance. Plusieurs valeurs ont été expérimentées pour le paramètre a, en fonction desquelles le paramètre k a été ajusté avec la méthode des moindres carrés (en prenant en compte les flux réels observés).

Trois variantes complémentaires du modèle gravitaire ont ensuite été élaborées:

  • un modèle gravitaire utilisant deux fonctions différentes pour la résistance de la distance: avec accroissement plus fort de cette résistance au delà d’un certain seuil : Fij = k Mi Mj dij -a avec a=a1 pour dij <= Seuil et a=a2 pour dij > Seuil et a1<a2 (dans le modèle présenté: a1= 1, a2=2 et Seuil = 50 km)

  • un modèle gravitaire à simple contrainte sur les destinations: avec conservation du nombre d’actifs venant travailler dans chaque commune dominante ou relais : Fij = s.j Mi Mj dij -a avec s.j = 1 / Somme( Mi * dij -a) , dans le modèle présenté: a = 1.8

  • un modèle gravitaire à simple contrainte sur les origines: avec conservation du nombre d’actifs quittant la commune pour aller travailler dans commune dominante ou relais Fij = ti. Mi Mj dij -a avec ti, = 1 / Somme( Mj * dij -a) , dans le modèle présenté: a = 1.8

Ensuite, les résultats de ces modélisations ont été confrontés aux données réelles avec deux approches: quantitative (écarts ou ‘résidus' entre les flux estimés et les flux constatés); et qualitative (comparaison des zones d’attractivité dominante prédites et constatées). L’objectif a été de distinguer la part prévisible des échanges (conforme au modèle) des relations particulières pouvant exister entre différents lieux.

Chargements des bibliothèques et des données

Analyse de l'organisation territoriale des flux domicile-travail
à partir des données du recensement

Analyse des concentrations d'emplois

Le département compte 287679 actifs ayant un emploi et 278830 emplois.
Les flux intradépartementaux s'élèvent à 258495 ,et concernent environ 89 % des actifs habitant le département.
Parmi ceux-ci, 160974 actifs ( 62 %) travaillent dans une commune différente de celle où ils résident.

Cartographie de la concentration des actifs en 2016

Le département compte:
- 110 communes avec deux fois moins d'emplois que d'actifs,
- 89 communes où le rapport emplois / actifs est compris entre 0.5 et 1,
- 42 communes où le rapport emplois / actifs est compris entre 1 et 2,
- 9 communes avec deux fois plus d'emplois que d'actifs.

Analyse des flux dominants et des zones de dominance

Les principales zones d'influence (selon le nombre de communes) sont:
-  Vannes ( 53  communes)
-  Lorient ( 30  communes)
-  Ploërmel ( 23  communes)
-  Pontivy ( 17  communes)
-  Auray ( 11  communes)
-  Josselin ( 8  communes)
-  Muzillac ( 6  communes)

Cartographie des flux dominants selon l'approche de Nystuen et Dacey

Comparaison de la modélisation des flux domicile-travail
avec quatre variante du modèle gravitaire

Ensemble de fonctions pour modéliser les flux

Première modélisation des flux avec un modèle gravitaire simple

Ajustement du modèle

Avant suppression valeurs extrêmes

                                 OLS Regression Results
=======================================================================================
Dep. Variable:             flux_reels   R-squared (uncentered):                   0.812
Model:                            OLS   Adj. R-squared (uncentered):              0.812
Method:                 Least Squares   F-statistic:                          3.314e+04
Date:                Sat, 08 Aug 2020   Prob (F-statistic):                        0.00
Time:                        21:43:03   Log-Likelihood:                         -37316.
No. Observations:                7657   AIC:                                  7.463e+04
Df Residuals:                    7656   BIC:                                  7.464e+04
Df Model:                           1
Covariance Type:            nonrobust
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
ind_grav       0.0005   2.48e-06    182.033      0.000       0.000       0.000
==============================================================================
Omnibus:                    10509.538   Durbin-Watson:                   1.968
Prob(Omnibus):                  0.000   Jarque-Bera (JB):         18987325.714
Skew:                           7.137   Prob(JB):                         0.00
Kurtosis:                     246.536   Cond. No.                         1.00
==============================================================================

Warnings:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
<statsmodels.regression.linear_model.RegressionResultsWrapper at 0x12c237b90>

Après suppression valeurs extrêmes

[]
                                 OLS Regression Results
=======================================================================================
Dep. Variable:             flux_reels   R-squared (uncentered):                   0.812
Model:                            OLS   Adj. R-squared (uncentered):              0.812
Method:                 Least Squares   F-statistic:                          3.314e+04
Date:                Sat, 08 Aug 2020   Prob (F-statistic):                        0.00
Time:                        21:43:41   Log-Likelihood:                         -37316.
No. Observations:                7657   AIC:                                  7.463e+04
Df Residuals:                    7656   BIC:                                  7.464e+04
Df Model:                           1
Covariance Type:            nonrobust
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
ind_grav       0.0005   2.48e-06    182.033      0.000       0.000       0.000
==============================================================================
Omnibus:                    10509.538   Durbin-Watson:                   1.968
Prob(Omnibus):                  0.000   Jarque-Bera (JB):         18987325.714
Skew:                           7.137   Prob(JB):                         0.00
Kurtosis:                     246.536   Cond. No.                         1.00
==============================================================================

Warnings:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.

Analyse des résidus du modèle

La distance moyenne (distance de Manhattan) des flux réels est de 19.23 km, alors que celle des flux estimés est de  21.01 km.
Le seuil est établi à 30.0 km, avec  1329 flux inférieurs à ce seuil et 6328 supérieurs.

Prévision des flux dominants

Le modèle a prédit la bonne destination pour le flux maximal de 194 communes (avec un taux de réussite de 78 %) et a enregistré 54 erreurs.

Deuxième modélisation des flux avec un modèle gravitaire
avec une résistance variable de la distance

Ajustement du modèle

Prise en compte des flux proches (avant suppression valeurs extrêmes)

                                 OLS Regression Results
=======================================================================================
Dep. Variable:             flux_reels   R-squared (uncentered):                   0.894
Model:                            OLS   Adj. R-squared (uncentered):              0.894
Method:                 Least Squares   F-statistic:                          1.119e+04
Date:                Sat, 08 Aug 2020   Prob (F-statistic):                        0.00
Time:                        21:44:20   Log-Likelihood:                         -7245.9
No. Observations:                1329   AIC:                                  1.449e+04
Df Residuals:                    1328   BIC:                                  1.450e+04
Df Model:                           1
Covariance Type:            nonrobust
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
ind_grav       0.0002   1.69e-06    105.759      0.000       0.000       0.000
==============================================================================
Omnibus:                      884.749   Durbin-Watson:                   1.785
Prob(Omnibus):                  0.000   Jarque-Bera (JB):           137233.980
Skew:                           2.100   Prob(JB):                         0.00
Kurtosis:                      52.605   Cond. No.                         1.00
==============================================================================

Warnings:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
<statsmodels.regression.linear_model.RegressionResultsWrapper at 0x12c22ba10>

Prise en compte des flux éloignés (avant suppression valeurs extrêmes)

                                 OLS Regression Results
=======================================================================================
Dep. Variable:             flux_reels   R-squared (uncentered):                   0.734
Model:                            OLS   Adj. R-squared (uncentered):              0.734
Method:                 Least Squares   F-statistic:                          1.742e+04
Date:                Sat, 08 Aug 2020   Prob (F-statistic):                        0.00
Time:                        21:44:21   Log-Likelihood:                         -20659.
No. Observations:                6328   AIC:                                  4.132e+04
Df Residuals:                    6327   BIC:                                  4.133e+04
Df Model:                           1
Covariance Type:            nonrobust
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
ind_grav       0.0047   3.53e-05    132.003      0.000       0.005       0.005
==============================================================================
Omnibus:                     7896.920   Durbin-Watson:                   1.923
Prob(Omnibus):                  0.000   Jarque-Bera (JB):          6276199.241
Skew:                           6.123   Prob(JB):                         0.00
Kurtosis:                     156.797   Cond. No.                         1.00
==============================================================================

Warnings:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
<statsmodels.regression.linear_model.RegressionResultsWrapper at 0x12bcae350>

Prise en compte des flux proches (après suppression valeurs extrêmes)

[]
                                 OLS Regression Results
=======================================================================================
Dep. Variable:             flux_reels   R-squared (uncentered):                   0.894
Model:                            OLS   Adj. R-squared (uncentered):              0.894
Method:                 Least Squares   F-statistic:                          1.119e+04
Date:                Sat, 08 Aug 2020   Prob (F-statistic):                        0.00
Time:                        21:44:26   Log-Likelihood:                         -7245.9
No. Observations:                1329   AIC:                                  1.449e+04
Df Residuals:                    1328   BIC:                                  1.450e+04
Df Model:                           1
Covariance Type:            nonrobust
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
ind_grav       0.0002   1.69e-06    105.759      0.000       0.000       0.000
==============================================================================
Omnibus:                      884.749   Durbin-Watson:                   1.785
Prob(Omnibus):                  0.000   Jarque-Bera (JB):           137233.980
Skew:                           2.100   Prob(JB):                         0.00
Kurtosis:                      52.605   Cond. No.                         1.00
==============================================================================

Warnings:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.

Prise en compte des flux éloignés (après suppression valeurs extrêmes)

[]
                                 OLS Regression Results
=======================================================================================
Dep. Variable:             flux_reels   R-squared (uncentered):                   0.734
Model:                            OLS   Adj. R-squared (uncentered):              0.734
Method:                 Least Squares   F-statistic:                          1.742e+04
Date:                Sat, 08 Aug 2020   Prob (F-statistic):                        0.00
Time:                        21:44:57   Log-Likelihood:                         -20659.
No. Observations:                6328   AIC:                                  4.132e+04
Df Residuals:                    6327   BIC:                                  4.133e+04
Df Model:                           1
Covariance Type:            nonrobust
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
ind_grav       0.0047   3.53e-05    132.003      0.000       0.005       0.005
==============================================================================
Omnibus:                     7896.920   Durbin-Watson:                   1.923
Prob(Omnibus):                  0.000   Jarque-Bera (JB):          6276199.241
Skew:                           6.123   Prob(JB):                         0.00
Kurtosis:                     156.797   Cond. No.                         1.00
==============================================================================

Warnings:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.

Analyse des résidus du modèle

La distance moyenne (distance de Manhattan) des flux réels est de 19.23 km, alors que celle des flux estimés est de  22.99 km.

Prévision des flux dominants

Le modèle a prédit la bonne destination pour le flux maximal de 194 communes (avec un taux de réussite de 78 %) et a enregistré 54 erreurs.

Troisième modélisation des flux avec un modèle gravitaire
et une contrainte sur les destinations
(nombre d'actifs venant travailler constant)

Ajustement du modèle

Le modèle dispose d'un coefficient de détermination de : 0.4

Analyse des résidus du modèle

La distance moyenne (distance de Manhattan) des flux réels est de 19.23 km, alors que celle des flux estimés est de  20.63 km.

Prévision des flux dominants

Le modèle a prédit la bonne destination pour le flux maximal de 219 communes (avec un taux de réussite de 88 %) et a enregistré 29 erreurs.

Quatrième modélisation des flux avec un modèle gravitaire
et une contrainte sur les origines
(nombre d'actifs constant quittant la commune)

Ajustement du modéle

Le modèle dispose d'un coefficient de détermination de : 0.96

Analyse des résidus du modèle

La distance moyenne (distance de Manhattan) des flux réels est de 19.23 km, alors que celle des flux estimés est de  23.23 km.

Prévision des flux dominants

Le modèle a prédit la bonne destination pour le flux maximal de 205 communes (avec un taux de réussite de 82 %) et a enregistré 43 erreurs.