Interaction sociale et usages d'Internet au Cameroun

Fambeu, Ariel; Bakehe, Novice

doi:https://doi.org/10.7202/1037208ar

Introduction

La période contemporaine est principalement marquée par deux phénomènes : la mondialisation et le développement de la société de l’information. La société de l’information est une forme spécifique d’organisation sociale dans laquelle la production, le traitement et la diffusion de l’information constituent les sources fondamentales de productivité et de puissance (Conte, 2001). L’émergence de celle-ci a été facilitée par le progrès rapide des technologies de l’information et de la communication (TIC). L’essor que connaissent les TIC (en particulier Internet) dans les domaines les plus divers de la société a notamment amené certains à prédire l’avènement d’une « nouvelle économie », une économie non pas soumise comme jusqu’ici à des fluctuations conjoncturelles, mais marquée par une croissance continue (OFS, 2006). Les facteurs de production traditionnelle (travail et capital) font place aux TIC.

Internet est l’un des facteurs essentiels de la mondialisation, facilitant à l’échelle mondiale la circulation de l’information, des capitaux, des idées, des produits, et de ce fait à très faible coût. Internet peut donc apparaître comme la technologie qui véhicule le plus d’espoir pour le sud et particulièrement les pays africains.

Mais alors que la nouveauté ouvre des perspectives inimaginables, elle a aussi le pouvoir d’accentuer sérieusement d’importants déséquilibres pour le moins indésirables (Renaud et Torres, 1996). En effet, s’il est vrai qu’Internet peut alléger les contraintes temporelles et spatiales, favoriser le renouvèlement des modes de consommation, encore faut-il que l’individu y ait accès et sache en faire bon usage : c’est la problématique de la fracture numérique.

La notion de fracture ou fossé numérique « the digital divide » a connu plusieurs développements dans des disciplines diverses et variées. Initialement, cette notion désignait l’écart existant entre les « info-riches » (information haves) et les « info-pauvres » (information have-nots) en termes d’accessibilité à l’information par le biais des technologies de l’information et de la communication (TIC) (Brotcorne et Valenduc, 2008). Cette perspective techniciste, qualifiée de fracture de « premier niveau[1] », place l’équipement technologique au centre de l’analyse et présuppose l’accès aux TIC comme une condition nécessaire à la richesse quel que soit le milieu économique, institutionnel et culturel où elles se diffusent. La fracture numérique se limitait ainsi à ses débuts aux inégalités d’accès aux TIC entendues au sens large, dans les pays de l’OCDE. Les conséquences avérées de ces inégalités sur le développement socioéconomique des pays ont étendu le débat au niveau mondial, incluant ainsi un paramètre nouveau aux inégalités internationales.

La définition de la fracture numérique a évolué au fil du temps. Désormais, elle ne se limite pas à une exclusion technique aux infrastructures TIC mais à l’usage qui en est fait. L’idée est que l’accès aux TIC, et plus spécifiquement à Internet, n’implique pas systématiquement son usage et son « bon » usage générant ainsi une maximisation de l’utilité associée. La logique de cette approche réside dans le fait que la réduction des inégalités numériques ne se limite pas à l’augmentation du nombre de connectés. Brotcorne et Valenduc (2008) définissent ainsi la fracture numérique comme la rupture entre ceux qui possèdent et utilisent les outils TIC (téléphone fixe et portable, ordinateur, Internet) et ceux qui ne les possèdent pas ou du moins ne savent pas les utiliser. En effet, et c’est une proposition de ce travail, la fracture numérique ne peut s’envisager uniquement du point de vue de la dotation, mais doit aussi concerner l’usage et même la fracture entre les usages (différents services qu’offrent Internet par exemple). On parle ainsi d’une double fracture (ou fracture numérique de second niveau) voire d’une fracture numérique multidimensionnelle. Baker (2001) propose une définition de la fracture numérique sous deux aspects différents selon que l’on se situe du côté de l’offre ou de la demande. Selon lui :

the digital divide can be conceptualized from a user standpoint as a suboptimal condition of :

access to technologies (the initial conceptualization of the digital divide), oriented to hardware, networking and access to advanced IT/Telecom services;

content available, that is, what services and information can be accessed; and,

Utility/awareness which relates to the actual value as well as the perceived value or awareness of the user/citizen/business of the use of ICTs and associated services.

Dans le même ordre d’idée, l’OCDE (2001a) définit la fracture numérique comme « l’écart qui existe entre les personnes, les ménages, les entreprises et les régions géographiques à divers niveaux socioéconomiques pour ce qui est de leur possibilité d’avoir accès aux TIC et de leur utilisation d’Internet ». Cette définition propose une autre dimension de la fracture numérique qualifiée de fracture « de deuxième niveau[2] ». C’est Kling (1998) qui propose cette double acception de la fracture numérique en faisant la différence entre (i) « the technical access » : l’accès aux infrastructures télécoms et informatiques et (ii) « the social access » qui renvoie à une dimension intellectuelle et sociale nécessaire pour une exploitation efficace des TIC.

Des enquêtes ont été administrées en Europe, aux Etats-Unis et même en Afrique subsaharienne auprès des ménages afin de comprendre et corriger les facteurs à l’origine du fossé numérique. Les études issues de ces enquêtes sont unanimes sur le fait que la fracture numérique est expliquée par des facteurs socioéconomiques (l’âge, le sexe, le niveau du revenu, le niveau d’études, la catégorie socioprofessionnelle, le nombre d’enfants, le lieu de résidence, etc.). Cependant, le rôle des interactions sociales reste très peu étudié aussi bien dans les pays développés que dans les pays en développement. De plus, quand elles sont étudiées les conclusions restent ambiguës, conséquences des différentes mesures des interactions sociales, de la nature des données et des méthodologies utilisées.

En Afrique, seulement 7 % de la population utilisent Internet et ce taux baisse à 5 % pour le Cameroun (ITU, 2012). Bien que déjà très faible, ce taux global cache de profondes disparités au niveau microéconomique[3]. Ces disparités deviennent encore plus profondes lorsqu’il s’agit des usages d’Internet (e-mail, recherche en ligne, téléchargement, e-learning, etc.). Les pratiques favorites des camerounais étant les communications interpersonnelles (Yahoo, facebook), la navigation (le surf) et très faiblement les téléchargements (ANTIC, 2007).

Dans un cadre à dotation égale[4], notre travail aborde donc la problématique de l’adoption (fréquence) des usages d’Internet entre les internautes avec comme fil conducteur les effets de pairs. En d’autres termes, nous essayons de répondre à la question suivante : est-ce que la pratique d’une activité en ligne d’un internaute est influencée par son entourage? dit autrement, l’utilisation fréquente d’une activité en ligne d’un internaute serait-elle favorisée par la proximité de cet internaute avec les personnes qui pratiquent déjà cette activité?

Alors que les effets des pairs ont largement été utilisés pour expliquer l’offre de travail (Grodner, Kniesner et Bishop, 2010), la réussite scolaire (Coleman, 1966; Aaronson, 1998; Sacerdote, 2001; Zimmerman, 2003; Angrist et Lang, 2004; Goux et Maurin, 2007; Ammermueller et al., 2009; Brodaty, 2010; Boucher, Bramoullé, Djebbari, Fortin, 2010), l’obésité (Christakis et Fowler, 2007; Trogdon et al., 2008; Fortin et Yazbeck, 2011; Yang et Huang, 2013; Peng Nie et al, 2014), la fraude fiscale (Fortin, Lacroix, Villeval, 2007; Galbiati et Zanella, 2008), etc., ils ont été très peu utilisés pour comprendre la fracture numérique.

L’originalité de cette étude est d’analyser pour la première fois, à notre connaissance, l’effet des pairs comme mesure des interactions sociales sur les usages d’Internet et d’en déduire les multiplicateurs sociaux associés à chaque usage. Ces usages sont mesurés en termes de communication interpersonnelle, recherche et téléchargement en ligne.

Le multiplicateur social des usages d’Internet permet de résumer l’importance des effets de propagation ou d’amplification dus à l’imitation ou au conformisme. Il se définit par le rapport entre l’impact d’un choc commun affectant le comportement d’usage des internautes en présence d’effets de pairs et l’impact de ce choc en l’absence d’effets de pairs (Glaeser, Sacerdote, et Scheinkman, 2003). Ainsi, si le multiplicateur social de la recherche en ligne est égal à 2, ceci signifie qu’un choc qui incite un internaute à faire la recherche en ligne en l’absence d’effets de pairs (effet direct), incitera deux internautes à adopter un tel comportement en présence d’effets de pairs (effet direct plus effet indirect).

Pour réaliser cette étude, nous disposons des données de l’enquête sur l’utilisation des TIC par les ménages et citoyens camerounais réalisée en 2008. L’estimation du modèle linéaire en moyenne avec restrictions d’exclusion par la méthode des variables instrumentales nous conduit à des multiplicateurs sociaux de 4,167 pour l’usage de la communication interpersonnelle en ligne, de 10,204 pour l’usage de la recherche en ligne et de 7,692 pour l’usage du téléchargement en ligne.

Cette étude complète également les travaux sur le processus d’adoption et d’usage des TIC au Cameroun où le rôle des effets des pairs est négligé (Mukoko, 2012), secondaire (Tamokwe, 2012; Mukoko, 2012; Tamokwe, 2013; Penard, Poussing, Mukoko et Tamokwe, 2015) ou ne permet pas de déduire le multiplicateur social (Mbondo, 2013).

La suite de l’article est présentée comme suit. Dans un premier temps, nous passons en revue les études sur la fracture numérique en présence d’interactions sociales. Dans un deuxième temps, nous discutons des difficultés entourant l’identification et l’estimation des effets de pairs. Nous présentons ensuite les données de notre analyse dans la section 3. La section 4 présente les résultats des estimations des effets des pairs et les implications politiques. Enfin, nous concluons.

1. La fracture numérique en présence d’interactions sociales

Alors que la sociologie et la psychologie se sont particulièrement attardées à l’étude des interactions sociales, les économistes s’y sont moins attardés étant donné qu’ils ont longtemps considéré les interactions entre les agents économiques comme étant le résultat du mécanisme des prix qui ne prend pas en compte les interactions sociales hors marché. Une des premières approches théoriques à avoir explicitement modélisée les interactions dans les choix individuels de consommation ou d’usage est l’économie des réseaux. Cette dernière, une des branches de la théorie de l’organisation industrielle, s’est développée à partir des années 1980 autour de notion d’externalités de réseau (Shapiro et Varian, 1998)[5].

Les premiers travaux empiriques de la fracture numérique se sont concentrés sur les facteurs qui influencent l’adoption et l’usage de l’ordinateur. Ces travaux ont mis en exergue les caractéristiques démographiques[6] (Brancheau et Wetherbe, 1990; Thong, 1999) et les variables de motivation [7](Davis, 1989; Igbaria et al, 1994; Atkinston et Kydd, 1997) comme des facteurs importants d’adoption de l’ordinateur.

Toutefois, il semble que le comportement des internautes ne dépend pas seulement de leurs caractéristiques individuelles, mais aussi et surtout des interactions avec leurs pairs. Dans ce sens, Goolsbee et Klenow (2002) examinent aux États-Unis les effets des pairs sur la diffusion de l’ordinateur à domicile et trouve que ces effets des pairs jouent un rôle important dans l’adoption de ce dernier. En contrôlant les caractéristiques individuelles, les estimateurs MCO et VI montrent que les individus sont enclins à acheter leur premier ordinateur à domicile dans les milieux où une forte proportion des ménages détient déjà un ordinateur ou lorsque la majorité de leurs amis ou membres de leur famille ont un ordinateur. Stanley (2003) dans une approche qualitative montre également le rôle des obstacles psychosociaux pour l’utilisation de l’ordinateur et suggère qu’il existe une relation complexe entre l’ethnicité, l’identité et l’attitude associée à l’ordinateur. L’idée centrale ici est que le réseau social de l’individu influence de façon significative la décision d’utiliser l’ordinateur. Dans cette étude, l’auteur montre qu’un individu n’utilise pas l’ordinateur parce qu’aucun de ces amis ne l’utilise.

Les recherches dans le domaine de l’utilisation d’Internet peuvent être classées en deux grands domaines :

Celles qui mettent l’accent sur les facteurs influençant l’adoption d’Internet (fracture de premier niveau) (Hindman, 2000; Van Dijk et Hacker, 2003; Penard et Suire, 2007; Agarwal et al, 2009; Mukoko, 2012; Mbondo, 2013; Tamokwe, 2013; Penard et al. 2015).
Celles qui mettent l’accent sur les facteurs influençant la fréquence d’utilisation d’Internet (fracture de second niveau) (Téo et al., 1999; Emmanouilides et Hammond, 2000) ou un type spécifique d’usage comme la e-banking, le e-commerce, la e-librairie, la e-administration, etc. (Hoffman, et al., 1996; Liao et al., 1999; Téo, 2001; Hong et al., 2002; Suire, 2007; Tamokwe, 2013; Penard et al., 2015).

Notre travail est étroitement lié aux travaux du deuxième groupe car nous distinguons trois types d’usages d’Internet étroitement lié aux mesures de Téo (2001). En effet, en adoptant une approche hiérarchique sur 1370 Singapouriens, Téo (2001) montre que les hommes sont plus engagés dans les activités de téléchargement et d’achat en ligne que les femmes, alors que celles-ci préfèrent les activités de messagerie et de téléchargement. Les activités de téléchargement et de messagerie en ligne sont plus utilisées par les jeunes que les personnes âgées. Quant aux variables de motivation, l’auteur trouve que l’utilité perçue est un facteur important pour les quatre activités en ligne (messagerie, navigation, téléchargement et achat) alors que la facilité d’utilisation perçue et le plaisir perçu sont associés aux activités de messagerie, de navigation et de téléchargement.

Le Guel, Penard et Suire (2005), sur un échantillon de 2000 individus bretons (France) ont mis en évidence l’importance des effets de l’entourage sur les comportements d’achats en ligne avec le voisinage social comme indicateur de l’entourage. Les résultats économétriques d’un modèle Probit expliquant l’adoption d’Internet font ressortir l’existence d’une fracture numérique de premier niveau tenant à des facteurs socioéconomiques et géographiques. Plus précisément, ils montrent que la probabilité d’achat en ligne est d’autant plus élevée que les internautes connaissent eux-mêmes des acheteurs en ligne dans leur entourage. Un voisinage dense d’acheteurs sur Internet a un effet rassurant et facilite l’apprentissage de la pratique (conseil de l’entourage sur le choix des sites marchands, sur les types de biens à acheter, sur les moyens de paiement électronique, etc.). Un tel voisinage permettrait ainsi de diminuer le risque perçu attaché au commerce électronique (si plusieurs personnes dans l’entourage annoncent qu’ils ont acheté en ligne et n’ont eu aucun problème, l’internaute sera beaucoup plus rassuré pour acheter à son tour en ligne). Selon ces auteurs, cet effet de voisinage a un pouvoir explicatif bien plus important que les caractéristiques socioéconomiques de l’internaute (niveau d’éducation, profession, âge, sexe, etc.). En d’autres termes, il est possible que l’usage marchand et même non marchand d’Internet soit une pratique en lien avec l’encastrement (ou voisinage) social des internautes (Granovetter, 1985).

L’introduction des effets des pairs pour prédire l’utilisation d’Internet à un niveau régional peut rendre le modèle plus puissant. En effet, en plus des infrastructures physiques, les relations sociales dans une région spécifique peuvent accélérer la diffusion de l’utilisation d’Internet. Les pairs, désignant les agents avec lesquels un individu est en interaction peuvent être les camarades de classe, les membres de la famille, les compagnons de chambre à l’université, les amis du quartier, etc. Hoxby et Weingarth (2006) synthétisent les différentes formes théoriques possibles que peuvent prendre les effets des pairs.

À partir de l’utilisation d’un modèle probit et des données du Grand-duché de Luxembourg relatives aux types d’associations[8] auxquelles appartient l’individu, Penard et Poussing (2006) arrivent aux conclusions suivantes : appartenir à une association de type « loisir » et « militant » ont tous deux des effets positifs sur la probabilité d’utiliser Internet, mais le type « militant » est non significatif. Il semble donc que l’effet réseau joue plus dans les associations de type « loisir ». Les réseaux sociaux physiques peuvent ainsi influencer la décision d’utiliser Internet. De même, Mbondo (2013) utilise un modèle probit simple pour détecter la présence favorable des effets des pairs dans les associations tontines responsable de l’adoption et de l’usage d’Internet des ménages camerounais. Il trouve que les effets des pairs jouent favorablement sur l’apprentissage et l’appropriation technologique qui sous-tendent l’adoption et les usages d’Internet non pas dans les tontines de type ROSCA (Rotating Savings and Credit Associations), mais au sein des tontines envisagées dans les catégories socioprofessionnelles suivant leur propension à utiliser des valeurs modernes pour le travail. Wellman et al. (2001) montrent qu’Internet est utilisé surtout pour maintenir les liens sociaux actifs entre des amis. Au-delà des relations interpersonnelles, les internautes peuvent aussi choisir leurs usages sur Internet par l’observation et plus largement par mimétisme au sens d’Orlean (1992)[9].

Agarwal et al. (2009) identifient les effets de pairs à travers le pourcentage des individus ayant adopté Internet et expliquent les différences d’utilisation aux États-Unis par les variations régionales. En effet, pour mesurer l’effet des pairs, les auteurs utilisent la proportion des utilisateurs d’Internet dans une région spécifique. Le revenu médian, l’âge médian et d’autres pourcentages liés à l’âge et au diplôme des utilisateurs sont des instruments valides pour résoudre le problème d’endogénéité. L’estimateur VI révèle un effet de pairs très important. Ces influences sociales sont plus importantes que les variables démographiques et régionales.

2. L’identification des effets des pairs

Dans l’une des études fondamentales de la littérature sur les interactions sociales, Manski (1993) a énoncé trois types d’effet pouvant expliquer les raisons pour lesquelles des personnes appartenant à un même groupe ont des comportements semblables. Dans son article, il propose un modèle statique dans lequel il modélise le choix individuel en fonction du comportement du groupe de référence.

L’effet de pairs endogène qui correspond à l’influence du comportement (moyen) du groupe de référence sur le choix d’un individu. Un effet endogène positif signifie ceteris paribus que le comportement moyen d’usages d’Internet dans un groupe tend à influencer positivement les usages d’Internet d’un internaute dans ce même groupe. Cet effet peut être causé par des effets d’imitation ou de conformité sociale, ou encore par la transmission d’informations sur les méthodes plus avantageuses d’utilisation. Il peut aussi s’agir d’un effet de concurrence. L’effet endogène est l’unique phénomène expliquant la présence d’un multiplicateur social.

Les effets de pairs contextuels surviennent lorsque les caractéristiques exogènes (moyennes) des pairs ont un impact sur le comportement d’un individu. Il peut s’agir par exemple de l’effet de l’âge moyen des internautes dans un groupe, ainsi que le sexe moyen, l’éducation moyenne, le revenu moyen, etc. Contrairement aux comportements des internautes, leurs caractéristiques sont exogènes et n’entrainent donc pas d’effets multiplicateurs. Un effet contextuel positif signifie que les usages d’un internaute varient dans le même sens que l’indice socioéconomique du groupe auquel il appartient.

Les effets corrélés sont difficilement mesurables et ils apparaissent en présence de caractéristiques similaires inobservées que les individus d’un même groupe partagent. Les effets corrélés peuvent émerger même sans lien causal. Il peut exister des effets corrélés pour deux principales raisons. Premièrement, en raison de l’autosélection dans le groupe, les internautes ayant des caractéristiques semblables peuvent avoir tendance à s’installer dans les mêmes régions. Deuxièmement, il peut y avoir des effets de chocs communs aux groupes (ou caractéristiques non observables). Par exemple, il peut être plus facile de télécharger en ligne dans certaines régions à cause des différences inter-régionales entre les infrastructures, le coût d’utilisation d’Internet ou les types tarifications. Les effets corrélés ne sont donc aucunement liés aux effets de pairs et ne génèrent pas de multiplicateur social.

Les effets endogènes et contextuels sont considérés comme des phénomènes sociaux et présentent un intérêt en termes de politique publique. Cependant, la distinction de ces effets pose un véritable défi qui a été pendant de nombreuses années au coeur des débats sur les politiques publiques.

Toutefois, l’estimation économétrique d’un modèle d’interactions sociales pose deux problèmes difficiles à résoudre : un problème d’identification et un problème d’observation du groupe de référence.

2.1 Le problème d’identification et d’observation du groupe de référence

Le problème d’identification provient de la difficulté de pouvoir séparer, d’une part, les effets d’interactions sociales des effets corrélés, et d’autre part, les effets endogènes des effets contextuels même en absence des effets corrélés. Cette deuxième forme de problème a été nommée le problème de réflexion et formellement étudié par Manski (1993). Les difficultés liées à l’identification de ces effets apparaissent parce que les individus s’affectent mutuellement et simultanément avec ceux de leur groupe de référence, ce qui rend l’identification impossible. Ces problèmes d’identification ont été posés par Manski (1993) et discutés entre autres par Bramoullé et al. (2009) et Blume et al. (2010).

Les trois effets des pairs sont présentés dans un modèle structurel linéaire-en-moyennes que nous tenterons d’estimer :

où y_ri mesure la fréquence d’utilisation d’une activité en ligne de l’internaute i du groupe r, x_ri est le vecteur formé à partir des caractéristiques individuelles et le vecteur formé à partir des caractéristiques moyennes des pairs. Nous supposons comme dans les travaux de Boucher et al. (2010) que les pairs de i sont les internautes dont l’usage d’une activité d’Internet et leurs caractéristiques individuelles ont un impact sur son usage. La fréquence d’usage moyen du groupe r est donnée par la variable [10].

α_r est le paramètre qui capte l’effet des caractéristiques non observables communes à tous les internautes d’un même groupe (effet fixe de groupe ou effet corrélés). Ces effets sont potentiellement corrélés avec les caractéristiques individuelles de l’internaute et les caractéristiques observables du groupe. Finalement, ε_ri est un terme aléatoire captant tous les autres facteurs inobservables qui déterminent la fréquence d’usage d’une activité en ligne de l’internaute i du groupe r. Il est d’usage de poser l’hypothèse que, sachant l’effet fixe de groupe, les variables explicatives du modèle sont strictement indépendantes de ce terme .

Le paramètre γ représente l’effet des caractéristiques individuelles. Le paramètre β représente l’effet de pairs endogène. Il est standard de supposer qu’en valeur absolue, β soit inférieur à l’unité, c’est-à-dire que |β| < 1. Dans ce modèle, le multiplicateur social de l’usage d’Internet correspond au ratio 1/(1 – β). En effet, en prenant la moyenne sur le groupe r de l’équation (1), on obtient .

On obtient donc . Le multiplicateur social est donné par . Ainsi, en l’absence d’effet de pairs endogène (β = 0), le multiplicateur social sera égal à un. Par contre, si l’effet des pairs endogène est de 0,5, le multiplicateur social sera de 2. L’identification de β permet donc d’identifier le multiplicateur social. Enfin, le paramètre δ représente l’effet contextuel des pairs.

Le problème d’identification consiste à estimer séparément l’effet de pairs endogène (β) et l’effet de pairs contextuel (δ). Il est clair qu’en présence d’effets corrélés de groupe (α_r), on ne peut identifier le modèle car ceux-ci, de même que la variable contextuelle () et la variable endogène (), ne varient pas à l’intérieur d’un groupe. Même en absence d’effets corrélés, Manski (1993) démontre qu’il est impossible d’estimer séparément les deux effets de pairs. La cause étant le problème de réflexion, car une valeur élevée de ε_ri pour un individu (par exemple un technophile) se reflète automatiquement dans sa fréquence d’utilisation () ainsi que dans la fréquence moyenne du groupe (). L’économètre ne peut alors pas déterminer si la corrélation entre et est causée par l’effet endogène ou si elle résulte simplement du reflet de ε_ri dans _[11].

Le deuxième problème que pose l’estimation des effets des pairs, est le problème d’observation du groupe de référence. Lorsque l’on tente d’expliquer les usages d’un internaute, le problème est de savoir si le groupe de référence (d’influence) se limite seulement aux internautes de son groupe (proximité de résidence). Advenant le cas où un internaute est peu influencé par les internautes à proximité de son lieu de résidence, mais fortement influencé par un autre groupe d’internautes tel que ses amis de classe ou ses collègues de travail, l’estimation des effets de pairs à l’aide de données sur le lieu de résidence sera nulle pour cet internaute, car l’économètre n’observe pas le bon groupe de référence pour l’individu.

Toutefois, il existe des méthodes économétriques permettant de contourner ces problèmes d’identification. Comme on le verra plus loin, chaque méthode repose sur une ou plusieurs hypothèses que l’on fait sur les données, les variables utilisées ou sur les groupes. Mais avant de passer aux méthodes d’estimations, il importe de passer en revue la littérature empirique sur l’identification des effets de pairs.

2.2 Brève littérature empirique sur l’identification des effets de pairs

L’origine de la littérature sur les effets de pairs se trouve dans le secteur de l’éducation avec la publication du rapport Coleman en 1966 aussi connu sous le nom de « Equality of Educational Opportunity Report ». L’un des principaux résultats de ce rapport est que dans les écoles américaines, la réussite des Noirs était liée positivement à la fraction d’élèves blancs dans leurs écoles. Ce résultat a été fortement critiqué pour certaines raisons concernant la méthodologie et les données utilisées. Plus précisément, le rapport ne prenait pas en compte le fait qu’une école avec un plus haut pourcentage d’élèves blancs puisse bénéficier de meilleures ressources qu’une école composée d’un plus faible pourcentage de Blancs. Les effets des pairs sont alors surestimés, lorsque les effets corrélés ne sont pas pris en compte et qu’ils sont attribués aux effets des pairs.

Winston et Zimmerman (2003) ont utilisé des données randomisées pour évaluer l’impact des caractéristiques des camarades de chambre sur la performance des nouveaux étudiants. Les auteurs ont estimé des effets significatifs et positifs de l’influence des caractéristiques des colocataires. Afin d’éliminer l’effet des facteurs inobservés responsable de la formation endogène des groupes, leurs stratégies reposaient sur l’assignation aléatoire des étudiants dans des dortoirs au Dartmouth Collège et au Williams Collège. En modélisant la note obtenue des nouveaux étudiants en fonction de la note des colocataires, Winston et Zimmerman (2003) trouvent que les étudiants fraichement arrivés au Williams Collège ont une forte propension à intégrer une fraternité si leurs camarades de chambre en sont déjà membres.

La technique des variables instrumentales reste la plus répandue dans les analyses lorsque les données ne permettent pas d’effectuer une randomisation. Cette stratégie s’appuie sur une source de variation exogène pour éliminer le biais d’endogénéité. Hanushek et al. (2003) ont utilisé des valeurs retardées des caractéristiques des pairs comme source de variation exogène pour évaluer l’impact des pairs sur la réussite académique. Les auteurs ont validé le modèle en utilisant des données de panel. Ils ont aussi introduit des effets fixes à plusieurs niveaux (écoles, classes et individus) pour purger l’effet des caractéristiques inobservées au cours de la période d’observation. Les résultats de leur étude ont montré qu’une augmentation d’un point dans la note moyenne en mathématiques des pairs améliore la note des élèves de 0,17. L’approche par effets fixes a été utilisée aussi par Burke et Sass (2006) avec des données sur les écoles publiques de la Floride. Les auteurs ont trouvé dans leurs estimations que les effets sont moins importants lorsque l’effet fixe enseignant est contrôlé.

En utilisant les données de santé, Trogdon et al. (2008) utilisent également une combinaison des effets fixes par école et des variables instrumentales pour estimer les effets des pairs sur le poids des adolescents. Ils constatent que l’augmentation d’un point de la moyenne de l’indice de masse corporelle des pairs entraine une augmentation de sa propre masse corporelle de 0,52 point. Utilisant une approche similaire avec le même type de donnés, Renna et al. (2008) trouvent également les effets de pairs positifs de 0,25 point. Cependant, les résultats sont peut-être inconsistants du fait que les instruments pris ad hoc ne sont pas pertinents. Aussi, la non-prise en compte des effets contextuels élimine le problème de réflexion tout en introduisant l’hypothèse d’exclusion restreinte qui n’a pas été testée. Les études de Yakusheva et al. (2014) arrivent également à la conclusion que les effets de pairs en gain de poids sont principalement significatifs parmi les femmes. Cependant, ces auteurs ne sont pas à mesure de tester si ces effets sont une conséquence des habitudes alimentaires.

L’étude conduite par Lee (2007) montre à l’aide d’un modèle linéaire en moyenne qu’on peut différencier les effets s’il y a suffisamment de variations dans la taille des groupes. Ce dernier démontre que l’identification des interactions sociales est possible dans le cadre d’un modèle spatial autorégressif dans un contexte social. Le modèle élaboré permet la présence de caractéristiques non observables dans la structure des groupes qui peuvent être corrélées avec une variable explicative. Les effets fixes de groupes permettent la prise en compte de la présence de tels effets corrélés. Avec ce modèle, Lee (2007) est en mesure de démontrer que l’identification de l’effet endogène séparément de l’effet exogène est possible s’il y a suffisamment de variation dans la taille des différents groupes. Il démontre que ce modèle peut être estimé par la méthode du maximum de vraisemblance conditionnelle ou une méthode de variables instrumentales généralisée.

L’approche de Bramoullé et al. (2009) généralise un nombre d’études précédentes dont les plus représentatifs sont ceux de Manski (1993), Moffitt (2001) et Lee (2007). En effet, Bramoullé et al. (2009) débutent par une extension du modèle linéaire en moyenne où les interactions sont structurées à travers le réseau social. Ils suggèrent que les effets corrélés non observables sont traités comme des effets fixes de réseau. Les auteurs montrent que les effets endogènes et exogènes sont généralement identifiés à travers le réseau d’interaction. Cependant, l’identification peut être erronée pour quelques structures particulières. L’utilisation des données sur les enquêtes de santé montrent un effet positif des effets de pairs endogène. Une augmentation de l’indice moyen d’activité récréationnelle des amis de l’élève à l’école entraine une augmentation de son indice récréationnelle de 0,466.

Dans ce travail, la démarche utilisée pour identifier les effets de pairs est empruntée aux travaux de Bramoullé et al. (2009). Cette démarche est construite sur un modèle linéaire en moyenne qui distingue nettement les effets des pairs endogènes, exogènes et corrélés. Cependant, avant de passer aux estimations, il importe de décrire les données utilisées.

3. Données

Généralement, l’analyse des usages d’Internet repose sur deux principales sources de données : d’une part les enquêtes par questionnaire et d’autre part les données de navigation d’internautes volontaires. Notre étude relève de la première démarche.

Pour mesurer la fracture numérique des usages d’Internet au Cameroun, nous utilisons une importante base de données en coupe transversale provenant de l’enquête réalisée par le GRETA[12], en partenariat avec l’université de Renne 1, l’université Omar Bongo de Libreville et le CEPS/INSTEAD du Luxembourg sur les technologies de l’Information et de la communication (TIC). Cette enquête est faite dans le cadre d’un projet de recherche sous-régional. Elle a été réalisée en 2008 auprès de 2650 ménages et citoyens Camerounais âgés de 15 à plus de 65 ans dans les villes de Douala (85,59 %), Buea (4,72 %) et Limbé (9,4 %). Dans la mesure où l’échantillon des ménages visités dans le cadre de cette enquête est fidèlement calqué sur celui de la troisième version de l’Enquête camerounaise auprès des ménages (ECAM) soutenue par la Banque mondiale, ces individus sont représentatifs de cette sous-population dans les trois villes. Douala est une ville francophone alors que Buea et Limbé sont essentiellement anglophones. Ces trois villes représentent donc une diversité socioculturelle, ce qui est important pour considérer les origines culturelles de comportement d’adoption et d’usage des technologies comme l’ont relevé les travaux d’appropriation des TIC de Mukoko (2012).

Outre les caractéristiques démographiques des enquêtés (âge, sexe, éducation, revenu, langue, etc.), l’enquête porte également sur l’accès aux TIC des ménages (matériels informatiques, téléviseurs, téléphones fixes et portables, lecteurs CD/DVD et MP3, appareils photo numériques, caméscope/camera vidéo, ordinateurs, Internet) et sur les usages des TIC, en particulier sur les usages d’Internet et leur intensité (e-mail, e-learning, e-administration, surfing, etc.). À ces données s’ajoutent aussi les associations auxquelles appartiennent les internautes et leur lieu de résidence.

Une question primordiale dans l’étude des effets d’interactions sociales est la définition des groupes de référence. Les données dont nous disposons nous fournissent une possibilité intéressante quant à la définition de ceux-ci. Comme il n’existe pas de méthode de définition rigoureuse (à moins d’avoir de l’information subjective sur les « pairs » de chaque internaute, ce qui n’est pas le cas ici), nous tenons compte de l’éloignement spatial entre les internautes. Le groupe de référence sera donc dans cette étude la commune dans lequel réside l’internaute. C’est la plus petite surface de proximité dont nous disposons dans l’enquête. Une commune est une division administrative, formée d’un territoire clairement défini, qui correspond généralement à une partie d’une ville, à une ville entière, ou à un bourg avec ses villages (France, Cameroun), ou un groupe de villages (Allemagne, Pays-Bas, Belgique, Suède, etc.). Dans la plupart des États, la commune est la plus petite subdivision administrative et elle s’inscrit dans d’autres maillages de taille plus importante (au Cameroun, la commune est incluse dans le département et le département dans la région). La commune est souvent régie par un conseil constitué de représentants élus (conseil municipal); au Cameroun, on désigne ces subdivisions administratives dirigées par un conseil élu comme des collectivités territoriales. Dans ce travail, on distingue neuf communes dont sept à Douala, une à Buea et une à Limbé.

Notre étude s’intéressant à la fracture numérique de second niveau (les usages d’Internet), l’échantillon à étudier est donc composé uniquement des individus qui utilisent déjà Internet (les internautes). C’est le nombre de répondants qui déclarent avoir utilisé Internet pendant les trois derniers mois, soit 546 internautes. Les informations concernant ces internautes seront ainsi utilisées pour construire l’ensemble de nos variables.

Notre échantillon nous fournit également les informations sur la fréquence d’utilisation de 18 activités (ou usages) en ligne. Nous regroupons ces activités en 3 types d’usages qui représenteront ainsi les trois variables expliquées de cette étude. Pour chaque activité, la fréquence d’usage est mesurée sur une échelle de quatre points. Le score 0 est attribué à une activité qui n’est jamais utilisée par un internaute; 1 à une activité qui est utilisée moins d’une fois par mois; 2 à une activité utilisée plusieurs fois par mois et 3 à une activité utilisée plusieurs fois par semaine. Ensuite, nous regroupons et additionnons les activités similaires pour avoir au final 3 types d’activités principales utilisées au Cameroun :

La communication interpersonnelle (« com ») : l’e-mail, les discutions en direct (MSN, Yahoo, Skype, etc.), la participation à des forums/blogs, la participation à des sites de réseau sociaux (Facebook, Twitter, Nedlog, etc.).
La navigation (ou recherche) (« nav ») : la recherche d’information sur l’actualité nationale ou internationale, sur la culture, sur les loisirs, sur les voyages et sur la santé; également la recherche d’information en relation avec les études ou le travail, etc.
Le téléchargement (« tel ») : le téléchargement de musique, de jeux, de films, d’images (grâce à Youtube, Daily Motion, Peer-to-Peer, etc.).

Ces trois usages sont donc des variables continues dont les statistiques descriptives sont présentées au tableau 1.

Les tableaux 2 et 3 (Annexe A) présentent respectivement la description et les statistiques descriptives des variables utilisées dans ce travail. Ainsi, dans notre échantillon, 64 % des internautes sont les hommes. La majorité des internautes sont jeunes, (40 % des internautes de l’échantillon ont entre 22 et 29 ans et 67 % entre 22 et 44 ans), avec une éducation moyenne de bac/bac+1. Avec un salaire minimum de 36 270 FCFA/mois (environ 68 dollars US) au Cameroun, seulement 19 % des internautes de l’échantillon déclarent que le coût d’Internet est le principal frein à son utilisation. Ces internautes disposent en moyenne d’un revenu mensuel de 73 mille FCFA (environ 137 dollars US) et 57 % d’entre eux sont célibataires. On constate aussi que les internautes sont majoritairement bilingues (58 %), suivis des francophones (32 %). Ils ont pour la plupart fait une formation formelle en informatique (85 % de l’échantillon) et 71 % d’entre eux résident dans les quartiers populaires (faible standing) contre 28 % et 1 % respectivement dans les quartiers résidentiels (standing moyen) et chics (haut standing).

Tableau 1

**Statistiques descriptives des variables dépendantes**

Concernant les usages d’Internet, 97 % des internautes de l’échantillon ont au moins une fois utilisé la communication interpersonnelle. Ce taux est de 91 % pour l’activité de recherche et 55 % pour le téléchargement en ligne. Cependant, la recherche en ligne est l’activité la plus fréquemment utilisée, avec un score moyen d’environ 7 contre 5 pour la communication interpersonnelle et 1,8 pour le téléchargement.

Pour estimer les effets des pairs, la démarche préliminaire consiste à vérifier si les internautes d’un groupe agissent de la même façon. S’il y a présence d’effets multiplicateurs, on s’attend à observer des concentrations de même type d’usage d’Internet. Dans chaque groupe, plusieurs internautes pratiquent une activité et peuvent encourager les autres à en faire autant, grâce à une relation d’apprentissage et de sécurité.

Nous comparons donc les niveaux d’homogénéité dans les comportements à l’intérieur des groupes en analysant les variances intragroupes. La variance intragroupe fait référence à la variance de la variable dépendante au sein d’un groupe d’internautes. Cette statistique mesure le niveau de similitude dans le comportement des internautes dans un groupe. Nous comparons les écart-types intragroupes. On peut aussi voir si les internautes semblent se comporter de façon similaire. Nous calculons cette mesure pour chaque groupe et prenons la moyenne sur l’ensemble des groupes comme le montre la formule suivante :

où R est le nombre de groupes, n_r est le nombre d’internautes dans un groupe r,y_ir est la variable « type d’usage » de l’Internet pour l’internaute i du groupe r et y̅_r est la moyenne des y_ir dans le groupe r. Le tableau 4 montre les résultats.

Ce tableau montre que lorsqu’on définit l’ensemble de l’échantillon comme étant un seul grand groupe, les valeurs de l’écart moyen des comportements de tous les internautes sont respectivement de 3,002, 4,882 et 2,226 pour la communication interpersonnelle, la recherche et le téléchargement en ligne. Lorsque le groupe est défini comme étant la commune, les écarts moyens sont respectivement de 2,97, 4,87 et 2,20. Ces écarts plus faibles que les premiers montrent qu’on pourrait avoir des comportements davantage similaires à l’intérieur de ces groupes que dans l’ensemble de l’échantillon.

Ces résultats semblent montrer une influence des pairs dans les communes sur les usages d’Internet. Les résultats économétriques viendront ainsi confirmer ou infirmer l’existence de ces effets de pairs.

4. Estimation des effets des pairs sur les usages d’Internet

Dans cette section, nous présentons les résultats de l’estimation des effets de pairs et les implications politiques. Nous estimons dans un premier temps un modèle linéaire en moyenne avec restrictions d’exclusion et dans un deuxième temps un modèle « within ». Cette deuxième approche permet ainsi d’identifier les effets de pairs en imposant relativement peu d’hypothèses comparée à la première.

4.1 Estimation du modèle linéaire en moyenne par restrictions d’exclusion

Cette approche consiste à imposer des restrictions d’exclusion sur les effets contextuels pour identifier l’effet endogène. Evans, Oates et Schwab (1992) furent parmi les premiers à adopter cette approche. La méthode est décrite en profondeur dans Graham et Hahn (2005). Plusieurs auteurs ont repris cette approche principalement à cause de sa simplicité et du fait que les variables contextuelles peuvent servir d’instruments (notamment Gaviria et Raphael, 2001; Trogdon, Nonnemaker et Pais, 2008; Agarwal et al., 2009; Bellemare, Fortin, Joubert et Marchand, 2012). Rappelons que le modèle de base que nous cherchons à estimer est le suivant :

où y̅_r – i et x̅_r – i correspondent aux moyennes des variables dans le groupe r excluant l’individu i. Rappelons que y̅_r – i est une variable endogène, c’est-à-dire qui est corrélée avec µ_ri. La méthode d’estimation consiste à utiliser x̅_r – i comme instrument pour y̅_r – i. Cet instrument doit être corrélé avec la variable endogène, mais non avec le terme d’erreur. L’absence de corrélation avec le terme d’erreur suppose que δ = 0 (c’est-à-dire qu’il n’y a pas d’effets contextuels : restriction d’exclusion dans le modèle structurel). Sous cette hypothèse, x̅_r – i sera un instrument valide pour y̅_r – i. La condition de corrélation avec la variable endogène sera remplie dans le cas de x̅_r – i si γ ≠ 0 (c’est-à-dire s’il y a présence d’effets individuels). Dans ce modèle, on considère les α_r comme des effets aléatoires plutôt que des effets fixes. On suppose ainsi que a_r n’est pas corrélé avec les variables que l’on considère comme exogènes (les x_ri).

Les résultats sont présentés dans le tableau 5 (Annexe B). Le test de Wald suggère que les effets contextuels sont non significatifs, individuels ou joints, pour les modèles de communication et de téléchargement. Nous imposons donc les restrictions d’exclusion sur toutes les variables contextuelles qui nous servirons d’instruments pour identifier ces modèles. Cependant, pour le modèle de recherche en ligne, le test de Wald suggère que les effets contextuels liés à l’âge, à l’éducation, à la langue, au type de formation, à la situation matrimoniale, à l’appartenance à une association et au coût d’Internet sont jointement significatifs. Par conséquent, ces variables contextuelles ne seront pas imposées par l’hypothèse de restrictions d’exclusion pour l’estimation du modèle de recherche en ligne tandis que les autres variables contextuelles serviront d’instruments (variables contextuelles liées à sexe, revenu, formation, assht, perform, quartier, conseil). Le test de Sargan nous conduit à ne pas rejeter l’hypothèse de validité des instruments et de restriction de suridentification pour tous les modèles (p-value suffisamment élevé). Ce test montre que les instruments choisis sont corrélés avec la variable endogène de droite (c’est-à-dire les usages des pairs), mais non corrélés avec les résidus du modèle structurel. Comme les statistiques du test de Stock et Yogo dépassent largement la valeur critique, on rejette l’hypothèse nulle que les instruments sont faibles (c’est-à-dire peu corrélés avec la variable endogène de droite). Ces deux derniers tests confirment la pertinence de la liste des instruments retenus (instruments valides et puissants) et viennent ainsi en soutien statistique des restrictions d’exclusion. En d’autres termes, les restrictions d’exclusion qui ont servi d’instruments permettent une bonne identification de notre modèle linéaire en moyenne.

S’agissant des résultats, on observe quelques effets individuels significatifs qui reviennent dans plusieurs usages. En effet, une éducation élevée augmente la fréquence d’usage de la communication et de la recherche, mais diminue la fréquence de téléchargement en ligne. Le téléchargement en ligne serait réservé aux personnes les moins éduquées. Le téléchargement pourrait être une activité réservée aux jeunes se livrant plus aux activités de divertissement (film, musiques, animations, etc.) alors que les plus éduquées sont plus enclins à faire de la recherche en ligne. Le revenu a un effet positif uniquement sur l’activité de recherche et n’influence pas la fréquence d’utilisation des deux autres activités. On constate également que la langue et le coût d’utilisation d’Internet influencent uniquement la communication et la recherche en ligne. Être francophone ou bilingue au mieux des cas renforce la fréquence d’utilisation de ces activités alors que le coût d’Internet est un obstacle à leur utilisation. La variable performance est également positive et significative, excepté dans le modèle de téléchargement (non significatif). Ce résultat montre qu’Internet est un outil qui augmente la productivité des individus et les encourage à continuer à l’utiliser. Le lieu de résidence a un effet mixte selon les usages. En effet, vivre dans un haut standing améliore la fréquence d’usage de la communication, réduit celle de la recherche et n’a aucun impact sur la fréquence de téléchargement en ligne.

On observe aussi que la quasi-totalité des effets contextuels qui n’ont pas été imposés par l’hypothèse de restriction d’exclusion sont significatifs, ce qui suggère que nous avons eu raison de ne pas supposer leur effet nul. Ce résultat nous montre que dans une commune, la moyenne d’éducation, de langue, du type de formation, de formation en informatique, du statut matrimonial, du nombre de tontine d’appartenance et de perception du coût d’Internet influencent la fréquence de recherche en ligne dans le même sens que leurs effets individuels respectifs.

Quant aux effets de pairs endogènes, on constate qu’ils sont significatifs et très élevés pour tous les usages en ligne. En effet, on observe les effets de 0,760 pour la communication interpersonnelle, 0,902 pour la recherche et 0,870 pour le téléchargement en ligne. Ainsi, par exemple, une augmentation de 10 % de la fréquence de téléchargement en ligne de ses pairs ferait augmenter la fréquence de téléchargement d’un internaute de 8,7 %. Il est peut-être plus rassurant d’adopter l’activité des pairs car ces derniers peuvent être des conseillers. Les conseils et l’assistance de l’entourage permettent d’économiser du temps dans la sélection des usages intéressants et dans l’apprentissage de ces usages. On peut donc déduire le multiplicateur social du téléchargement en ligne à 7,692 [1/(1 – 0,870)]. Ce multiplicateur social est de 4,167 pour la communication et de 10,204 pour la recherche en ligne. Ceci signifie qu’un choc qui incite un internaute à faire plus de recherche en ligne en l’absence d’effet des pairs (effet direct), incitera au moins dix internautes à adopter un tel comportement en présence d’effets de pairs (effet direct plus effet indirect). Il est donc d’une importance capitale de bien mesurer le multiplicateur social dans l’évaluation des programmes de lutte contre la fracture numérique car un gouvernement pourrait réussir à réduire la fracture des usages d’Internet en mettant en place une initiative qui ne ciblerait qu’un nombre restreint d’individus. L’impact de cette initiative, par contagion au sein de leur réseau social, pourrait ensuite s’étendre au-delà de la population directement touchée par la mesure. Les effets d’imitation, de conformité, de transmission d’information et de concurrence qui se manifestent au niveau local peuvent aussi expliquer une plus grande concentration des comportements dans certaines régions (Glaeser, Sacerdote, et Scheinkman, 2003; Graham, 2008), mais également les effets d’apprentissage et de sécurité. Il en résultera donc une plus grande homogénéité intrarégionale des comportements en ligne qu’entre les différentes régions.

Ce résultat confirme les travaux de Mbondo (2013) qui, en utilisant un modèle probit trouve l’effet de pairs responsable de l’adoption d’Internet à travers les tontines de catégorie socioprofessionnelle au Cameroun. Aussi, en utilisant la méthode de variables instrumentales avec restrictions d’exclusion Agarwal et al. (2009) trouvent un multiplicateur social de l’utilisation d’Internet de 2,63 aux États-Unis.

4.2 Estimation du modèle within par la méthode des variables instrumentales

Le modèle utilisé est un modèle linéaire en moyenne avec effets fixes de groupe inspiré de l’approche spatiale autorégressive. Ce modèle est le résultat des contributions de Manski (1993), Moffit (2001), Lee (2007) et Bramoullé, Djebbari et Fortin (2009). Le modèle linéaire en moyenne se démarque du modèle élaboré par Manski (1993), car il mesure les variables des pairs comme étant des moyennes des résultats et caractéristiques observées (excluant l’individu) au lieu de les mesurer en termes d’espérance (Manski, 1993). Le problème d’identification peut alors être résolu grâce à la non-linéarité introduite par l’approche spatiale autorégressive étant donné que la mesure de la variable des pairs varie entre tous les individus, même ceux du même groupe. Ainsi, l’identification sera possible lorsqu’il y aura suffisamment de variation dans les tailles de groupe (Bramoullé et al. 2009).

L’avantage de ce modèle par rapport au précédent est qu’il permet non seulement de séparer les effets individuels, endogènes et contextuels, mais aussi de tenir compte des effets fixes de groupe (effets des caractéristiques inobservées), effets considérés comme aléatoires dans le modèle précédent. La forme structurelle du modèle est donnée par l’équation suivante :

Rappelons que β capte l’importance de l’effet endogène, δ capte l’importance des effets contextuels, et γ capte les effets individuels. Ce modèle pose deux problèmes importants. Premièrement, soustraire les effets fixes (α_r) du modèle impliquerait ici de soustraire également tous les effets qui sont spécifiques aux groupes, dont les effets endogènes et contextuels. Deuxièmement, comme expliqué plus haut, le problème de réflexion fait que les variations de ε_ri sont directement liées aux variations de y̅_r , ce qui empêche d’estimer l’effet endogène même en absence d’effets corrélés. Le modèle de Bramoullé et al. (2009) pose cependant l’hypothèse que l’internaute est exclu de son groupe de référence, ce qui permet de contourner ces deux problèmes. On obtient ainsi le modèle suivant :

où m_r est la taille du groupe r. Pour identifier les paramètres, il nous faut trouver une équation within c’est-à-dire, en déviation à la moyenne du groupe. Cette reformulation nous permet d’éliminer les effets fixes de groupe (ou effets corrélés). La forme réduite en déviation s’écrit :

où les moyennes des variables sont calculées avec tous les membres du groupe (incluant l’internaute i). Notons qu’à l’intérieur d’un groupe r, chaque internaute i qui est exclu du groupe, est influencé par ses propres variables endogènes et contextuelles et . Ces variables ne sont pas spécifiques aux groupes, mais aux internautes. Ainsi, en calculant les variables en déviation par rapport aux moyennes des groupes, on élimine les effets corrélés (spécifiques aux groupes) mais non les effets endogènes et contextuels.

Cette équation within est celle qui nous permet d’identifier nos paramètres mais uniquement lorsque les groupes (au moins trois) ont des tailles différentes. Si les groupes ont la même taille, l’effet de groupe ne peut être identifié parce que les coefficients inclus dans ne peuvent être identifiés à partir de l’équation (4). Cette forme réduite contrainte est caractérisée par trois coefficients. Pour identifier ces coefficients, il nous faut au moins trois tailles différentes de groupe[13].

Pour estimer ce modèle, nous allons utiliser la méthode des variables instrumentales. Afin d’utiliser cette méthode d’estimation, nous devons écrire le modèle sous forme matricielle. Il s’agit maintenant de calculer la moyenne sur tous les voisins de l’individu « i » ou tout simplement calculer la moyenne sur les « j » individus. Cette méthode consiste à faire une différence locale, soit de soustraire à l’équation (3), la moyenne des « j » individus. Cette approche est appelée « approche locale » étant donné que la moyenne est effectuée sur les « j » individus et non sur les « i » individus. En notation matricielle, l’équation (3) à laquelle est appliquée une transformation locale en différence par rapport à la moyenne devient :

où y_r est un vecteur (N × 1) des y_i et x_r est un vecteur (N × K) variables explicatives x_i

G est une matrice d’interaction sociale qui sert à pondérer l’influence des usages des pairs sur l’usage de l’internaute. La matrice G est définie comme suit : , matrice (N × N) de la forme : , on suppose que l’internaute est influencé par l’usage de chacun des ses pairs, ce qui fait que les éléments hors-diagonale de G sont tous égaux à . Comme l’internaute est exclu de son groupe, les éléments sur la diagonale sont égaux à zéro. Donc, chaque bloc , r = ₁,…,R. I est la matrice identité (m_r × m_r).

L’équation (7) est estimée par les moindres carrés en deux étapes en utilisant les instruments suivants : . Ces instruments sont naturels au modèle, car dans un groupe, tout le monde est lié à chacun.

Ces instruments sont donc valides pour (I – G)Gy_r (Bramoullé et al. 2009). La matrice des régresseurs est .

Les résultats de l’estimation sont présentés dans le tableau 6 (Annexe B). Ce tableau présente les estimations du modèle within avec et sans effets contextuels par la méthode 2SLS, en prenant comme instrument la matrice (I – G)G²X. Le test de Wald suggère que les effets contextuels sont jointement significatifs à 1 %. Ce résultat est contraire à celui de De Melo (2011) qui estime des effets contextuels non significatifs sur la performance scolaire d’étudiants uruguayens. Les résultats de ce dernier vont dans le même sens avec l’idée que les effets contextuels sont davantage présents au sein du noyau familial ou du réseau d’amis qu’au sein d’un réseau formé d’individus géographiquement proches. La statistique du test de Stock et Yogo[14] dépassant la valeur critique dans les modèles sans effets contextuels, on rejette l’hypothèse nulle que les instruments sont faibles (c’est-à-dire, peu corrélés avec la variables endogène de droite). Cependant, la faiblesse de cette statistique pour les modèles avec effets contextuels ne nous permet pas de rejeter l’hypothèse de la faiblesse des instruments. La grande taille des communes considérées peut être à la source de la faiblesse des instruments (Boucher et al., 2010). Par ailleurs, pour les modèles avec effets contextuels le test de Sargan nous conduit à ne pas rejeter l’hypothèse de validité des instruments et de restriction de suridentification avec un niveau de significativité de 5 %. La significativité des effets contextuels, la validité et la force des instruments dans les modèles à effets exogènes nous conduisent à choisir ces derniers comme les modèles en « déviation » les plus explicatifs des usages d’Internet au Cameroun.

Les résultats des estimations montrent que les effets individuels sont semblables à ceux des estimations par restrictions d’exclusion. Les effets contextuels, qui représentent les effets des caractéristiques moyennes des autres internautes du groupe, ne sont pas statistiquement significatifs pour le modèle de téléchargement. Cependant, seuls deux effets contextuels (revenu moyen et performance moyenne) sont significatifs pour la recherche en ligne. Par ailleurs, la communication interpersonnelle est influencée significativement par plusieurs variables contextuelles (effets contextuels liés à l’éducation, à la participation aux tontines, à la perception du coût d’Internet, au lieu de résidence et au rôle de conseiller).

L’effet de pairs endogènes est négatif et significatif quel que soit l’usage d’Internet. Ceci voudrait dire qu’un internaute utilise moins une activité en ligne si cet usage est fréquent chez ses pairs. Bien qu’un effet endogène négatif soit plutôt surprenant, il pourrait être expliqué par deux effets. Tout d’abord, cela peut être dû à un effet de découragement qui viendrait du fait qu’étant dans un groupe où les internautes excellent dans une activité, l’internaute peut être impressionné et découragé à fournir plus d’effort se disant que de toute façon il ne sera pas à la hauteur des autres internautes de son groupe. Ce résultat pourrait aussi être expliqué par un effet de congestion qui est dû à la façon dont les ressources sont allouées aux internautes dans le groupe. Ainsi, les internautes fréquents peuvent réclamer et attirer les moyens d’utilisation d’Internet (cybercafé, ordinateur, tablette, téléphone intelligent, infrastructures de télécommunications, etc.) se favorisant ainsi en négligeant les internautes moins fréquents. Cet effet de congestion contribue ainsi à creuser l’écart entre les internautes.

Cependant, les valeurs estimées de β sont très élevées, avec |β| 1. Il est important de noter que ces résultats décevants pourraient provenir de la méthode d’estimation. En effet, il se peut que le groupe de référence utilisé ne soit pas le bon pour estimer l’influence des pairs. Nous utilisons une référence spatiale (la commune), mais il est possible que l’influence des pairs se fasse à travers un réseau familial ou d’amis qui ne font pas partie du groupe à la commune. Ces résultats biaisés de l’identification des pairs peuvent également provenir de l’observabilité partielle des internautes du groupe de référence (Davezies et al., 2009). En effet, par l’estimation du modèle « within », nous supposons (à tort) que l’on observe tous les internautes de l’ensemble de chaque groupe. Pourtant, nous n’observons qu’une faible proportion des internautes dans chacun des groupes échantillonnés. Lorsqu’on diminue la proportion d’individus observés, le biais augmente progressivement vers le bas comme c’est le cas dans ce travail. La forme fonctionnelle linéaire du modèle qui ne permet pas de prendre en compte la non-linéarité dans les effets des pairs est également une source de biais.

Au final, l’estimation du modèle « within » ne nous permet pas d’identifier correctement les effets de pairs endogènes pour les raisons qui viennent d’être mentionnées (problème d’identification du bon groupe de référence, problème d’observabilité partielle et non-prise en compte de la non-linéarité). Par contre, l’estimation du modèle linéaire en moyenne avec restrictions d’exclusion a conduit à une identification des effets de pairs plus fiable (⎟β⎟ < 1). De plus, l’estimation avec restrictions d’exclusion est avantageuse dans ce travail car ses hypothèses qui nous permettent d’identifier le modèle ne sont pas affectées par la proportion d’individus observés dans le groupe comme dans le modèle « within ». Par ailleurs, les tests statistiques de Wald, Sargan et Stock-Yogo viennent conforter les hypothèses de ce modèle et montrent ainsi qu’il est le plus approprié, et par conséquent le modèle retenu pour cette étude. Les résultats qui ressortent de ce modèle avec restrictions d’exclusion nous permettent ainsi de proposer quelques recommandations afin de réduire la fracture numérique de second niveau au Cameroun.

4.3 Implication des politiques publiques

Les résultats de ce travail montrent qu’en termes de fracture numérique au second niveau, les groupes cibles habituels de la fracture de premier niveau ne sont pas nécessairement pertinents. Par exemple, les femmes, les personnes âgées et les personnes à faible revenu ne sont pas des utilisateurs significativement vulnérables. Par ailleurs, il en ressort que, pour en accroître les chances d’efficacité, les politiques d’inclusion numérique au Cameroun doivent reposer sur plusieurs axes :

Élever le niveau moyen d’éducation, améliorer les aptitudes en bilinguisme et adopter des politiques favorisant la concurrence dans le secteur des TIC pour inciter les fournisseurs d’accès à Internet à réduire les prix;
Faire une sensibilisation axée sur l’utilité des usages d’Internet (11 % des utilisateurs dans l’échantillon estiment qu’Internet manque d’intérêt et d’utilité). En effet, les politiques en matière de société de l’information reposent souvent sur le présupposé qu’un développement accéléré de l’offre de services et de contenus en ligne va entraîner ipso facto une sorte de démocratisation de l’utilisation des TIC. C’est d’ailleurs la thèse des théories classiques de diffusion des innovations. Ces utilisateurs peu motivés peuvent parfois être réticents au « matraquage » des discours promotionnels de la société de l’information, et il faudrait par exemple mettre l’accent sur les avantages comparatifs des services en ligne dans leur propre cadre de vie et sur les facilités nouvelles qu’ils pourraient découvrir;
Créer des points d’accès public numériques tout en favorisant l’accompagnement et la socialisation (16 % des utilisateurs de l’échantillon estiment qu’ils manquent d’accompagnement et qu’Internet est trop compliqué). Cet accompagnement marquerait ainsi une particularité majeure par rapport aux points d’accès commerciaux comme les cybercafés. Cette offre inédite d’accompagnement à l’apprentissage et à l’utilisation d’Internet que proposeraient ces points d’accès est un moteur de rencontre, de métissage et de socialisation. Cette socialisation permettrait aux personnes isolées de diversifier leurs usages;
Cibler les utilisateurs isolés. En effet, la diffusion des usages sur Internet ne pourra pas se faire sans des politiques d’accompagnement plus ciblées. Nous avons vu en particulier que la nature du voisinage social ou de l‘internaute jouaient un rôle clé, par le biais des effets de confiance, de sécurité et d’apprentissage. Les pouvoirs publics pourraient donc cibler leurs actions sur ceux qui ont peu ou pas d’internautes dans leur voisinage. On pense d’abord à des politiques de formation et d’information vers les internautes isolés qui faute d’informations, sous-utilisent Internet et peuvent en être déçus. À la lumière de nos résultats, un gouvernement pourrait réussir à restreindre ou à favoriser les usages d’Internet en mettant en place une initiative qui ne ciblerait qu’un nombre restreint d’individus. L’impact de cette initiative, par contagion au sein de leur réseau social, pourrait ensuite s’étendre au-delà de la population directement touchée par la mesure.

Cette étude présente plusieurs limites tenant à la nature des données. Tout d’abord, pour la mesure des interactions sociales, il aurait été bien de disposer d’informations sur les usages des différents membres du ménage, des amis ou du voisinage proche. On peut également regretter l’absence des réponses relatives à l’usage marchand et l’e-administration, nous permettant de comparer les comportements d’usage marchand et non marchand par rapport au voisinage social. Par ailleurs, nous relevons qu’un des points insuffisamment traités porte sur le lien entre un usage et les pairs d’un usage différent. Cette prise en compte des effets croisés pourrait ainsi rendre le modèle plus explicatif. En d’autres termes, on pourrait par exemple voir l’impact des utilisateurs de l’activité de téléchargement sur l’internaute qui pratique la recherche ou la communication interpersonnelle en ligne. Dans les recherches à venir, il serait intéressant d’intégrer toutes ces limites dans des modèles plus avancés avec une base de données plus riche.

Malgré ces limites, cette étude est à notre connaissance une des premières à évaluer le rôle des effets des pairs sur la fracture numérique de second niveau et nous espérons qu’elle suscitera d’autres de ce type.

Conclusion

Dans cette étude, nous avons essayé d’évaluer le rôle des interactions sociales sur les usages d’Internet à travers les effets des pairs endogènes. L’effet de pairs endogène mesure l’impact du comportement en ligne des pairs d’un internaute sur son usage d’Internet. Les résultats présentés dans ce travail, l’une des premières études des effets de pairs dans les usages d’Internet, permettent d’appuyer l’hypothèse selon laquelle une tendance au conformisme social joue un rôle non négligeable dans la dynamique qui sous-tend les usages d’Internet. Cette conclusion a des conséquences importantes sur l’impact des politiques publiques visant à réduire la fracture numérique. C’est pourquoi il est crucial de bien mesurer le multiplicateur social. L’effet de pairs endogène peut être à la source d’un multiplicateur social. Celui-ci vient amplifier l’impact direct d’un choc qui stimule ou au contraire décourage les usages d’un internaute.

Notre stratégie empirique a été dans un premier temps d’imposer les restrictions d’exclusion pour identifier les modèles d’usages d’Internet malgré la forte observabilité partielle des groupes de référence dans les données. Ces restrictions d’exclusion sur les variables contextuelles ont servi d’instruments puissants et valides permettant l’identification de l’effet de pairs endogènes. Nous avons dans un deuxième temps estimé conjointement les effets endogènes, contextuels et corrélés en exploitant les variations de taille des groupes telles que suggérées par Bramoullé et al. (2009). Cette approche a l’avantage de permettre en théorie de séparer les trois effets recherchés en imposant un nombre restreint d’hypothèses économiques et statistiques. En pratique cependant, l’estimation du modèle en déviation par la méthode des variables instrumentales produit des résultats fortement biaisés lorsqu’on l’applique aux données camerounaises sur les usages des TIC par les citoyens. Plusieurs explications ont été avancées dont les plus importantes sont le choix du groupe de référence et l’observabilité partielle des internautes.

Bien que cette deuxième approche permette d’identifier les effets de pairs en imposant relativement peu d’hypothèses, elle ne permet pas de corriger le biais d’endogénéité. Par contre, le biais semble corrigé par l’estimation du modèle linéaire en moyenne avec restrictions d’exclusion. L’avantage de l’estimation par restrictions d’exclusion provient du fait que les hypothèses qui nous permettent d’identifier le modèle ne sont pas affectées par la proportion d’individus observés dans un groupe. Ce modèle linéaire en moyenne avec restriction a ainsi été retenu comme le plus approprié pour estimer le multiplicateur social des usages d’Internet.

Les multiplicateurs sociaux trouvés issus des effets de pairs endogènes sont très élevés. On trouve un multiplicateur de 10,204 pour la recherche en ligne (7,692 pour le téléchargement et 4,167 pour la communication interpersonnelle en ligne), ce qui, bien que légèrement imprécis, est très élevé. En utilisant avec prudence le résultat de 10,204, cela signifierait qu’une politique qui aurait comme effet direct d’augmenter (ou de réduire) la fréquence d’utilisation de la recherche en ligne d’une unité de pourcentage, aurait comme effet d’augmenter (ou de réduire) cette fréquence de 10,204 unités de pourcentage en présence de pairs endogènes. Donc, l’impact d’une politique de lutte contre la fracture de l’usage de la recherche en ligne est 10,204 fois plus élevé lorsqu’on tient compte des effets des pairs.

Interaction sociale et usages d'Internet au Cameroun

Résumé

Introduction

1. La fracture numérique en présence d’interactions sociales

2. L’identification des effets des pairs

2.1 Le problème d’identification et d’observation du groupe de référence

2.2 Brève littérature empirique sur l’identification des effets de pairs

3. Données

4. Estimation des effets des pairs sur les usages d’Internet

4.1 Estimation du modèle linéaire en moyenne par restrictions d’exclusion

4.2 Estimation du modèle within par la méthode des variables instrumentales

4.3 Implication des politiques publiques

Conclusion

Annexes

Annexe A. Statistiques descriptives

Annexe B. Résultats des estimations

Remerciements

Notes

Bibliographie

Liste des tableaux

Résumés

Résumé

Corps de l’article

Introduction

1. La fracture numérique en présence d’interactions sociales

2. L’identification des effets des pairs

2.1 Le problème d’identification et d’observation du groupe de référence

2.2 Brève littérature empirique sur l’identification des effets de pairs

3. Données

4. Estimation des effets des pairs sur les usages d’Internet

4.1 Estimation du modèle linéaire en moyenne par restrictions d’exclusion

4.2 Estimation du modèle within par la méthode des variables instrumentales

4.3 Implication des politiques publiques

Conclusion

Parties annexes

Annexes

Annexe A. Statistiques descriptives

Annexe B. Résultats des estimations

Remerciements

Notes

Bibliographie

Liste des tableaux

Outils de citation

Citer cet article

Exporter la notice de cet article