• No results found

Patrons d'activitat a Twitter depenent de la latitud i estacionalitat

N/A
N/A
Protected

Academic year: 2022

Share "Patrons d'activitat a Twitter depenent de la latitud i estacionalitat"

Copied!
30
0
0

Laster.... (Se fulltekst nå)

Fulltekst

(1)

TREBALL FI DE GRAU

PATRONS D'ACTIVITAT A TWITTER DEPENENT DE LA LATITUD I ESTACIONALITAT.

Carles Cortés Tejada

Grau de Física Facultat de Ciències

Any Acadèmic 2019-20

(2)
(3)

PATRONS D'ACTIVITAT A TWITTER DEPENENT DE LA LATITUD I ESTACIONALITAT

Carles Cortés Tejada

Treball de Fi de Grau Facultat de Ciències

Universitat de les Illes Balears

Any Acadèmic 2019-20

Paraules clau del treball:

Patrons, Activitat, Twitter, Correlació.

Nom Tutor/Tutora del Treball : Pere Colet Rafecas Nom Tutor/Tutora (si escau) : Pere Colet Rafecas

S'autoritza la Universitat a incloure aquest treball en el Repositori Institucional per a la seva consulta en accés obert i difusió en línia, amb finalitats exclusivament acadèmiques i d'investigació

Autor Tutor Sí No Sí No

(4)
(5)

Abstract

Aquest treball es centra en analitzar els patrons d’activitat presents a una xarxa so- cial de nom reconegut com ´es Twitter, tenint en compte la localitzaci´o geogr`afica, les franges hor`aries i l’estacionalitat. Mitjan¸cant el c`alcul de correlacions entre s`eries de dades obtingudes a partir del nombre de tweets i el moment de publicaci´o dels mateixos.

S’analitzaran les similituds en els comportaments de 12 ciutats europees a partir de m`etodes de representaci´o de dades com grafs i arbres recubridors. Aquests comporta- ments estan ´ıntimament lligats amb les activitats socio-econ`omiques dels col·lectius que s’estan tractant de descriure, tal com la longevitat del descans durant les jornades de treball, la diferenciaci´o entre dies laborables i caps de setmana, les diferents posicions geogr`afiques arreu del continent, i els despla¸caments horaris dels propis pa¨ısos.

(6)

´ Index de continguts

1 Introducci´o. 7

2 Fonamentaci´o, metodologia i tractament de dades. 9 3 An`alisi estad´ıstic dels patrons d’activitat a Twitter. 14 3.1 Patrons d’activitat associats a cada ciutat. . . 14 3.2 Correlacions i despla¸caments temporals entre patrons d’activitat. . . 15 3.2.1 Consideracions generals. . . 15 3.2.2 Correlacions entre patrons d’activitat: de dilluns a divendres, a

l’horari d’hivern. . . 17 3.2.3 Correlacions entre patrons d’activitat: de dilluns a divendres, a

l’horari d’estiu. . . 18 3.2.4 Correlacions entre patrons d’activitat: dissabtes i diumenges, a

l’horari d’hivern. . . 20 3.2.5 Correlacions entre els patrons d’activitat: dissabtes i diumenges a

l’horari d’estiu. . . 21

4 An`alisis i disccusi´o dels resultats 23

4.1 Interpretaci´o de resultats. . . 23 4.2 An`alisi gr`afic. Clusters i arbres d’expansi´o. . . 26

5 Comentaris finals 29

(7)

1 Introducci´ o.

Quan es parla de xarxes socials el que pot venir a la ment en primer lloc s´on webs com Facebook o Twitter, o aplicacions com Snapchat o Instagram. Per`o l’idea ´es bastant m´es antiga, des de finals del segle XIX la sociologia ha estudiat el concepte de xarxa social per analitzar interaccions entre individus, grups, organitzacions o b´e, fins i tot, societats completes. El seu ´us ha augmentat de forma exponencial durant les dues ´ultimes d`ecades i ´es ara quan es comencen a realitzar estudis acad`emics per iniciar un an`alisis que aprofundeixi en la relaci´o entre el comportament social de certs col·lectius i l’´us d’aquestes eines multim`edia. Des de les jornades de treball o dies de descans, fins les posicions geogr`afiques dels llocs on resideixen els individus, l’´us de les xarxes socials es veu afectat de moltes formes. En aquest estudi, es pret´en analitzar els patrons d’activitat presents a la xarxa social Twitter depenents de la localitzaci´o geogr`afica i l’estacionalitat a diferents ciutats europees.

Els sistemes complexos estan composts per una gran quantitat de parts entrella¸cades.

Aquests sistemes mostren comportaments emergents, ´es a dir, comportaments que sorgeixen de la interacci´o entre les parts i que depenen molt poc de la din`amica individual de cada una de les components. Un exemple d’un sistema complex s´on les societats humanes, formades per individus connectats entre s´ı, on el comportament general no nom´es dep`en del funcionament d’una persona, sin´o que tamb´e juga un paper important la interrelaci´o que hi ha entre els habitants de la pr`opia societat. En l’actualitat, s’estan intentant car- acteritzar aquests comportaments col·lectius. Una manera d’estudiar-los ´es analitzar els patrons de comunicaci´o que hi ha entre els individus que formen aquest col·lectiu i, en aquest estudi, es far`a a trav´es de les xarxes socials.

Els patrons d’activitat humana, a m´es de per les interaccions entre els individus, ve- nen marcats per ritmes circadians, els quals depenen de condicions ambientals externes com ara la llum i la temperatura. Ciutats amb latituds molt diferents tenen condicions ambientals distintes i, per tant, podem esperar que els patrons d’activitat vari¨ın d’una localitzaci´o geogr`afica a una altre.

Un fus horari correspon, en principi, a dividir el planeta fent ´us dels meridians en 24 parts, de manera que a cada fus horari l’hora ´es la mateixa. Cada fus est`a centrat a un meridi`a, i aquests estan separats entre s´ı per distancies m´ultiples a 15 graus. El fus horari de cada regi´o es defineix respecte l’horari UTC que ´es el que correspon al del meridi`a de Greenwich, a la ciutat de Londres. Degut a que la terra gira cap a l’Est, al passar d’un fus horari a un altre en aquesta direcci´o s’afegeix una hora. Amb el mateix raonament, quan es canvia de fus horari en direcci´o Oest se li ha de restar. Per una banda estan aquests fusos horaris que sortirien de forma natural i, per l’altre, estan els horaris oficials de cada pa´ıs, que poden correspondre o no al fus natural. Les ciutats analitzades en aquest estudi estan localitzades a Europa. Lisboa, Londres i Dubl´ın utilitzen l’horari UTC a l’hivern i UTC+1 a l’estiu. Totes les altres ciutats utilitzen l’horari d’Europa central: l’UTC +1 a l’hivern i l’UTC+2 a l’estiu. Tota aquesta situaci´o provoca casos com el d’Espanya, en el que el seu horari oficial no es correspon amb el cicle de llum solar, ja que per la seva localitzaci´o geogr`afica li hauria de correspondre l’horari UTC+0 i no el t´e en cap `epoca de l’any.

(8)

Figura 1: Horari solar enfront horari oficial. Les tonalitats blaves indiquen una difer`encia positiva entre el cicle solar i l’hora oficial, en canvi, les vermelles una difer`encia negativa.

El color ´es m´es intens a mesura que la difer`encia ´es m´es gran. (Font: Adaptaci´o d’una imatge de [1]).

A la Figura 1 podem veure els horaris oficials a Europa, delimitats en diferents zones segons el fus horari, 0 (UTC+0), +1 (UTC+1) i +2 (UTC+2). A m´es, es representa el desajust que hi ha entre aquesta hora oficial i el cicle solar per cada pa´ıs. Es pot observar com en un mateixa zona hor`aria, tenim pa¨ısos amb situacions completament distintes. Nacions com Su`ecia, per exemple, t´e una difer`encia positiva entre el cicle de llum solar i l’hora oficial, de manera que el primer est`a retardat respecte el segon. En canvi, podem veure com Espanya t´e una diferencia negativa, ´es a dir, l’horari natural est`a avan¸cat respecte l’oficial. Aquest fet ´es a causa de que durant la Segona Guerra mundial es va decidir, per motius militars, obtenir el mateix horari oficial que utilitzava Alemanya [2]. Una vegada finalitzada la guerra, altres pa¨ısos com Portugal o Regne Unit establiren el seu retorn al fus horari de Greenwich, mentre que Espanya, actualment, segueix amb aquest reajust .

Aquests desajustos indueixen a que els costums i les activitats humanes, com ara el dinar, entre ciutats amb el mateix horari per`o amb distint cicle solar estan despla¸cats.

Aquests desajustos tamb´e es veuen reflectits alprime time de la televisi´o. Pa¨ısos com per exemple Alemanya, amb un prime time que comen¸ca sobre les 20:00h, tenen despla¸cat aquesta franja hor`aria respecte a altres pa¨ısos com Espanya, amb un prime time que s’inicia sobre les 22:30h. A m´es, als pa¨ısos localitzats m´es al nord com Alemanya o als Pa¨ısos baixos es sopa m´es prest que a Espanya. Aix`o ´es degut a que el seu horari de cicle de llum solar ´es distint. En la mateixa l´ınia, les jornades de feina s´on distintes segons la naci´o. A les zones m´es fredes, l’aturada del migdia per dinar ´es de menor temps. En canvi, per exemple a Espanya, hi ha costums com la de fer una pausa llarga al migdia,

(9)

que es veu reflectida amb el tancament de les botigues, que no les tenen als pa¨ısos n`ordics.

Per aquest motiu, les jornades de treball acaben m´es prest a pa¨ısos del nord d’Europa que als del sud [3].

Fa anys que hi ha un debat entorn s´ı Espanya hauria de canviar el seu horari oficial a l’horari natural. S’han realitzat diferents estudis sobre els inconvenients i beneficis que tendria tornar o no al fus horari que li correspon, entre els quals es troba la idea de ser m´es eficients, tant en l’horari laboral com en la vida personal [4]. En aquest treball s’analitzar`a l’activitat humana des de un `ambit com les xarxes socials, amb les quals no hi ha horari un establert ni cap tipus d’obligaci´o a utilitzar-les. Es veur`a si es mantenen patrons similars i si hi ha o no un despla¸cament temporal entre els pa¨ısos

En els darrers anys, les noves tecnologies de la informaci´o i de les comunicacions pro- porcionen una gran quantitat de dades. Aix`o ha provocat un renovat inter`es en estudiar din`amiques de poblaci´o com els patrons d’activitat i de mobilitat. S’han estudiat aquests patrons mitjan¸cant dades de cridades telef`oniques per un sol pa´ıs. Els resultats trobats indiquen que les ciutats a mesura que estan ubicades m´es a l’oest respecte de la ciutat m´es a l’est analitzada, detenen la seva activitat telef`onica m´es tard [5]. Aix`o implica que els esdeveniments solars actuen sobre les activitats que realitzam els humans. Altres articles han estudiat amb an`alisi massiu de dades dels tel`efons m`obils no nom´es el comportament dels individus, sin´o com estan estructurades les distintes ciutats espanyoles [6]. Aquestes refer`encies ens serviran per poder comparar si els resultats de les ciutats espanyoles que s’analitzaran en aquest treball coincideixen amb els resultats d’aquests estudis.

Tamb´e s’han realitzat investigacions amb dades de Twitter en les que s’han analitzat patrons globals de sincronitzaci´o en les comunicacions humanes. S’ha trobat que cada

`

area urbana t´e la seva pr`opia caracter´ıstica, per`o mostren que les difer`encies detectades entre patrons de distintes ciutats del m´on s´on consistents amb una nova sincronia global.

Est`a clar que la sincronia local ´es la for¸ca m´es representativa, per`o es comen¸ca a veure aquesta nova sincronia global, ´es a dir, un tipus de patr´o universal [7]. Tal i com es mostrar`a m´es endavant, podem preveure que les pautes que trobarem entre ciutats del mateix pa´ıs tendran formes similars (sincronia local). En aquesta treball analitzarem si entre ciutats amb longituds similars per`o latituds diferents, com per exemple, Barcelona, Par´ıs i Amsterdam, obtenim els mateixos patrons o no, i si aquests estan despla¸cats temporalment un dels altres degut a aquesta difer`encia de latituds.

2 Fonamentaci´ o, metodologia i tractament de dades.

A continuaci´o s’explicar`a quines dades han estat analitzades en aquest estudi, aix´ı com quines ciutats i quin per´ıode temporal s’ha considerat. A m´es, s’explicar`a la metodologia emprada per analitzar les dades.

Un tweet no sols est`a format pels 280 car`acters que el constitueixen, tamb´e cont´e informaci´o addicional anomenada metadata. Aquesta inclou, entre altres, l’hora a la que s’ha publicat el tweet, l’identificador de l’usuari i, tamb´e, pot incloure la localitzaci´o des d’on s’ha realitzat. Tota aquesta informaci´o est`a en format .json.

(10)

Aquest estudi ha estat possible degut a l’exist`encia d’aquests tweets amb geolocalitzaci´o.

Degut a que el que ´es vol realitzar ´es un estudi estad´ıstic, i hem de conservar la privacitat dels usuaris d’aquesta xarxa social, no ens interessa ni el contingut, ni qui ho va publicar.

Per aquest fet, ens centrarem en classificar els tweets segons l’hora i el lloc on s’han realitzat. S’han utilitzat els repositoris de l’IFISC (Institut de F´ısica Interdisciplin`aria i Sistemes Complexos). A causa de l’an`alisi massiu de dades que s’havia de realitzar, en base de la Llei de Protecci´o de Dades i la confidencialitat dels usuaris de la xarxa social, tot el tractament de dades s’ha realitzat als servidors i repositoris d’aquest Institut, que ens han estat habilitats per aquesta feina.

Tal i com s’ha dit anteriorment, s’han escollit diferents capitals d’arreu d’Europa per tal d’analitzar l’aflu`encia d’aquests tweets. Notem que cada una d’elles t´e creada una capsa virtual centrada a la zona central de la mateixa ciutat, de manera que si les coordenades associades a cada un dels tweets estan incloses dins aquesta capsa, queda registrat als tweets provinents d’aquesta ciutat, fent efectiu un registre m´es senzill d’aquestes dades.

Espec´ıficament, un total de dotze ciutats europees es veuran analitzades durant aquest estudi, en concret, les que es troben a la seg¨uent llista:

Figura 2: Ciutats analitzades a l’estudi.

- - Berl´ın a Alemanya.

- Brussel·les a B`elgica.

- Barcelona i Madrid a Espanya.

- Par´ıs a Fran¸ca.

- Mil`a i Roma a It`alia.

- Londres al Regne Unit.

- Dubl´ın a la Rep´ublica d’Irlanda.

- Estocolm a Su`ecia.

- Amsterdam als Pa¨ısos Baixos.

- Lisboa a Portugal.

En quant al per´ıode temporal que s’ha analitzat, t´e el seu abast des de l’octubre de l’any 2014 fins a novembre de l’any 2017. Degut a que el darrer diumenge de mar¸c i d’octubre, respectivament, es realitza el canvi d’horari d’hivern a estiu, o viceversa, hem dividit les dades segons l’`epoca en la que es van publicar. A m´es, els patrons d’una mateixa ciutat tenen forma distinta segons si la publicaci´o va ser entre setmana o en cap de setmana, per tant, s’ha tengut en compte aquesta distinci´o. Probablement aix`o sigui causa de les jornades de treball, ja que, majorit`ariament, a les grans ciutats, la poblaci´o activa fa feina de dilluns a divendres. Aquesta difer`encia de patrons tamb´e es far`a patent a l’apartat de resultats. D’aquesta manera, hi haur`an quatre conjunts de dades:

(11)

a) Tweets enviats entre setmana entre l’´ultim diumenge de mar¸c i l’´ultim diumenge d’octubre que correspon amb l’horari d’estiu.

b) Tweets enviats durant els caps de setmana entre l’´ultim diumenge de mar¸c i l’´ultim diumenge d’octubre que correspon amb l’horari d’estiu.

c) Tweets enviats entre setmana entre l’´ultim diumenge d’octubre i l’´ultim diumenge de mar¸c que correspon a l’horari d’hivern.

d) Tweets enviats durant els caps de setmana entre l’´ultim diumenge d’octubre i l’´ultim diumenge de mar¸c que correspon a l’horari d’hivern.

Pel que fa a les magnituds associades a les dades de cada una de les ciutats, ´es important notar que la regi´o d’Estocolm compta amb un nombre de tweets aproximat d’un mili´o, en canvi, notam un fort increment dels mateixos quan xerram, per exemple, de la capital anglesa (Londres), amb un total aproximat de vint milions de tweets. Les altres deu capitals, es troben dins aquests l´ımits. Aquesta quantitat tant fluctuant del nombre de tweets influir`a d’una manera important de cara al an`alisi estad´ıstic que es presentar`a m´es endavant. La quantitat de tweets de cada ciutat que s’han analitzat est`an a la taula 1.

Estocolm 1072386 Dubl´ın 1955984 Berl´ın 1999921

Roma 2063743

Mil`a 2688614

Lisboa 3661507

Barcelona 4507636 Brusel·les 4643558 Amsterdam 5350323

Madrid 6465993

Paris 9185068

Londres 19971674

Taula 1: Nombre de tweets analitzats a cada ciutat.

La representaci´o de cada un dels patrons es dur`a a terme a partir d’una s`erie d’histogrames amb depend`encia directa temporal. Per tant, s’han de discretitzar les 24 hores del dia en intervals de temps. Degut a l’estudi estad´ıstic qu`e es pret´en realitzar, per tenir uns resultats fiables, s’ha de considerar la ciutat amb la menor quantitat de tweets (Estocolm) i agafar uns intervals de temps conseq¨uents. ´Es a dir, si per aquesta ciutat es discretitzen les hores del dia en intervals de 10 minuts obtenim que d’un interval de temps al seg¨uent hi ha un canvi brusc del n´umero de tweets. En conseq¨u`encia, obtenim un histograma amb massa renou. Per tal de minimitzar aquest problema, considerarem intervals de 30 minuts per a totes les ciutats.

Llavors, la idea central de cara a l’an`alisi de les dades ser`a analitzar totes les dades que tenim de cada ciutat i simplificar-les en 4 llistes, segons si els tweets es van publicar a l’hivern o a l’estiu i si va ser entre setmana o cap de setmana. Cada un d’aquests conjunt

(12)

de dades contindr`a un total de 48 elements, degut a la discretitzaci´o escollida. L’objectiu principal ´es la comparaci´o entre les diferents ciutats en per´ıodes de temps iguals, per exemple, la comparaci´o ´unica pel que fa als caps de setmana d’una mateixa estaci´o, o per una altre banda, la comparaci´o durant els dies de jornada laboral regular.

Respecte a la forma de quantificar la similitud entre patrons es realitzar`a de la mateixa manera que s’estudien a l’econof´ısica les s`eries financeres, ´es a dir, com a s`eries de dades individuals. Per calcular la correlaci´o, hem de definir primer una nova variable, de mit- jana zero i escalada amb la desviaci´o t´ıpica tal que:

S ˜

i

(t

k

) ≡ S

i

(t

k

) − hS

i

i

T

σ = S

i

(t

k

) − hS

i

i

T

p hS

i2

i

T

− hS

i

i

2T

(1)

On ˜Si(tk) ´es el n´umero de tweets en l’interval de temps k, hSiiT la mitjana de la s`erie i σ la desviaci´o t´ıpica. A partir d’aquesta nova variable podem introduir el vector unitari

Si = 1n( ˜Si(t1), ...,S˜i(tn)). La correlaci´o entre dues s`eries i i j, amb el mateix nombre de dades n, ´es defineix com el producte escalar dels seus vectorsS~˜i i S~˜j :

ρ

ij

= h S ˜

i

S ˜

j

i

T

= 1 n

n

X

k=1

S ˜

i

(t

k

) ˜ S

j

(t

k

) (2)

Onρij ∈[−1,1]. Un valor proper a 1 implica que les dues s`eries que estem comparant tenen un alt nivell de correlaci´o entre elles, un valor proper a 0 que no estan correla- cionades i proper a -1 si estan anti-correlacionades. Que dues s`eries de dades estiguin molt correlacionades significar`a que els dos patrons d’activitat s´on clarament similars. En el nostre an`alisis, esperam que no hi hagi anti-correlacions, ´es a dir, que les correlacions estiguin entre [0,1], degut a que les persones, majorit`ariament, tenen els mateixos costums b`asics. Per exemple, esperem que l’activitat a la xarxa social durant la nit sigui m´es baixa que durant el dia, independentment de la ciutat que s’analitzi. Definim com a matriu de correlacions a la matriu que t´e com a elements ρij, ´es a dir, les correlacions que hi ha entre els patrons d’activitat de totes les ciutats amb totes. Per tant, aquesta matriu ser`a de dimensi´o 12 x 12 i, per la seva pr`opia definici´o ser`a sim`etrica, ja queρijj i. A m´es, contindr`a una diagonal plena d’uns ja que ρii = 1. Al haver fet distinci´o entre estiu i hivern, i entre setmana i cap de setmana, tendrem 4 matrius de correlacions distintes.

Per tal de quantificar si hi ha despla¸caments temporals entre els patrons de les distintes ciutats, el que es far`a ser`a fer permutacions c´ıcliques, ´es a dir, despla¸car la posici´o dels elements dels vectors S~˜i de cada ciutat de la seg¨uent forma:

(1,2,3)→(3,1,2)→(2,3,1)→(1,2,3)

(13)

D’aquesta manera, es pot calcular la correlaci´o entre el patr´o de cada ciutat sense despla¸car i totes les possibles permutacions c´ıcliques de les altres ciutats. ´Es pot veure per quina permutaci´o c´ıclica ´es m`axima la correlaci´o, i, per tant, es pot construir una matriu amb aquestes correlacions m`aximes i els despla¸cament temporals que hi ha entre els patrons quan aquesta ´es m`axima.

A partir de les correlacions discutides anteriorment es pot definir una dist`ancia entre els patrons i i j definida com la dist`ancia eucl´ıdia entre els vectors S~˜i iS~˜j :

d2ij =kS~˜i−S~˜jk2 = 1 n

n

X

k=1

( ˜Si(tk)−S˜j(tk))2 = 1 n

n

X

k=1

( ˜Si2(tk)+ ˜Sj2(tk)−2 ˜Si(tk) ˜Sj(tk)) = 2−2ρij

d

ij

= q

2(1 − ρ

ij

) (3)

D’aquesta manera, dij estar`a entre [0,2]. La dist`ancia augmenta al disminuir la cor- relaci´o, per tant, ser`a propera a 2 si existeix anti-correlaci´o; si hi ha una gran correlaci´o ser`a propera a 0 (dij = 0 si i=j). De la mateixa forma que amb les correlacions, podem definir una matriu de dist`ancies que tendr`a les mateixes dimensions, 12 x 12, tamb´e ser`a sim`etrica, per`o en aquest cas la diagonal contindr`a ´unicament zeros.

A partir d’aquesta matriu de dist`ancies, i utilitzant la Teoria de Grafs, es pot construir l’arbre d’expansi´o. Aquesta teoria ´es una branca de les matem`atiques que estudia els grafs, que s´on estructures matem`atiques que s’utilitzen per modelar relacions entre parelles d’objectes. Sigui un graf amb N nodes (en el cas particular d’aquest treball seran les 12 ciutats) units mitjan¸cant M enlla¸cos amb un cert pes (la dist`ancia), es poden construir varis arbres. Un arbre es un tipus de graf en el que qualsevol parell de nodes estan units nom´es per un sol cam´ı. ´Es a dir, no hi poden haver triangles ni cap cam´ı c´ıclic. Per qualsevol graf es possible construir al menys un arbre que connecti tots els nodes. Aquest arbre s’anomena arbre d’expansi´o o recubridor del graf i per un graf de N nodes t´e N-1 enlla¸cos. De fet per un graf donat hi poden haver molts arbres recubridors diferents.

El denominat arbre d’expansi´o m´ınim es aquell que la suma dels pesos dels enlla¸cos ´es la menor possible. Pot haver m´es d’un arbre recubridor m´ınim per la mateixa matriu de dist`ancies, per`o la suma d’aquests pesos ha de ser la mateixa. Tot arbre d’expansi´o m´ınim t´e associat un arbre jerarquic, el qual permet visualitzar si dues ciutats estan correlacionades entre s´ı, ja que si pertanyen a la mateixa branca, tamb´e anomenades clusters, tendran patrons similars. Una comparaci´o per entendre el que significa l’arbre d’expansi´o m´ınim podria ser, per exemple, un arbre geneal`ogic. Que dos familiars estiguin a la mateixa branca vol dir que seran m´es propers entre ells, per`o aix`o no implica que dues persones en branques diferents no tenguin relaci´o.

En aquest estudi s’han calculat els arbres d’expansi´o m´ınims mitjan¸cant l’algoritme de Kruskal [8]. Donat un graf, ´es comen¸ca triant l’enlla¸c de menor pes. Seguidament, ´es tria el seg¨uent enlla¸c de menor pes. Despr´es es tria el seg¨uent enlla¸c de menor pes sempre i quan no formi un triangle amb els enlla¸cos pr`eviament triats. I aix´ı successivament es van triant els enlla¸cos de menor pes que no formin triangles fins que tenim tots els nodes connectats.

(14)

3 An` alisi estad´ıstic dels patrons d’activitat a Twit- ter.

A partir de l’explicat a la secci´o anterior i de cara a l’an`alisi de dades, s’exposen a continuaci´o els resultats obtinguts. Aquest an`alisi est`a estructurat en subseccions, formades per l’estudi i interpretaci´o dels patrons d’activitat individual de cadascuna les ciutats, per despr´es passar a l’an`alisi de les correlacions m`aximes i els seus despla¸caments a cada cas general i, finalment, acabar amb un an`alisi gr`afic mitjan¸cant grafs.

3.1 Patrons d’activitat associats a cada ciutat.

Es presenta la distribuci´o hor`aria dels tweets normalitzada de manera que l’`area sigui 1 (densitat de probabilitat horaria dels tweets). ´Es mostren els quatre patrons d’activitats d’inter`es: els dies laborals (de dilluns a divendres) i els caps de setmana (dissabte i diumenge), diferenciant les `epoques d’estiu i hivern.

Figura 3: Patrons d’activitat a twitter normalitzats per les 12 ciutats. Per cada un d’ells s’han representat els 4 casos considerats segons s’ha explicat a l’apartat anterior.

En color vermell, entre setmana d’hivern, amb blau, entre setmana d’estiu, amb taronja, els caps de setmana d’hivern i, amb verd, els caps de setmana d’estiu.

(15)

Comportaments generalitzats a totes les ciutats poden ser obtinguts observant la Figura 3. Un exemple remarcable ´es l’exist`encia recurrent d’un pic del nombre de tweets notable a les primeres hores del mat´ı els caps de setmana. Aquest fet ´es conseq¨u`encia directa de la pr`opia jornada laboral, que es troba estandaritzada al llarg del continent, normalment de dilluns a divendres durant aproximadament vuit hores.

Com s’ha dit amb anterioritat, les caracter´ıstiques geogr`afiques de les urbs europees tindran un fort efecte de cara als patrons d’activitat existents. Un exemple contundent

´

es el cas de la capital de l’estat espanyol, Madrid, on es troba un m`axim local del nombre de tweets escrits al mat´ı, seguit d’una gran disminuci´o cap a hores del mig dia per acabar d’augmentar a la tarda, aproximadament a les 20:00 hores. Aquest comportament ´es present a altres regions situades al mateix meridi`a tal com Barcelona o Lisboa. Enfront a aquesta conducta agafem la ciutat de Berl´ın com a contraexemple. La capital germana t´e un r`egim m´es homogene¨ıtzat durant les hores del dia, incl´us, ´es prou dif´ıcil diferenciar l’escriptura de tweets entre caps de setmana i dies amb jornada laboral, a qualsevol de les dues estacions. Aquesta actuaci´o ´es compartida tamb´e amb regions com Londres o Dubl´ın.

Aquestes difer`encies notables entre Madrid i Berl´ın poden ser degudes, principalment, a la pausa al migdia a la jornada laboral. Tal i com hem dit abans, les ciutats al sud d’Europa tendeixen a tenir llargues pauses laborals que es veuen reflectides a les activitats empresarials d’aquests tipus de regions. En aquests casos, la poblaci´o est`a acostumada a descansar al mig dia, acte que es veu reflectit en la disminuci´o l’activitat a les xarxes socials. Per l’altre part, els pa¨ısos al nord d’Europa no tenen aquestes grans pauses a les jornades laborals, fet que fa que les seves ciutats tenguin una activitat a la xarxa social m´es homog`enia.

Un altre aspecte a tenir en compte ´es l’efecte dels diferents cicles solars a cada regi´o.

L’alba i la posta de sol es d´ona m´es prest a ciutats localitzades a l’est d’Europa que a regions situades a l’oest com Portugal o Regne Unit. Aquest comportament t´e una relaci´o

´ıntima amb l’an`alisi fet anteriorment comparant Madrid, Berl´ın, i les seves activitats laborals. El comen¸cament de l’activitat a les urbs est`a relacionada amb l’horari de l’alba, per tant, ´es usual que aquest inici sigui m´es d’hora a les ciutats on la sortida del sol es d´ona abans.

De cara a un an`alisi matem`atic-estad´ıstic de la semblan¸ca existent entre els diferents patrons d’activitats de cada ciutat, es presenta a continuaci´o un estudi de les correlacions corresponents per cadascun dels quatre casos que s’estan estudiant.

3.2 Correlacions i despla¸ caments temporals entre patrons d’activitat.

3.2.1 Consideracions generals.

El nucli central de l’an`alisi dels patrons d’activitat es basa en l’obtenci´o de les correspo- nents correlacions entre les ciutats anteriorment proposades, a m´es de veure com afecten els despla¸caments temporals a les mateixes. El procediment adient a la presentaci´o dels resultats ´es el que es presenta a continuaci´o.

En primer lloc es presentar`a la corresponent matriu de correlacions, on es troben as- senyalats en color vermell el valor m`axim i m´ınim de les mateixes. Aquesta matriu es

(16)

determina a partir de l’Equaci´o 2, amb una dimensi´o de 12x12. Cal destacar la positivitat de tots els valors presents a les matrius ja que estem parlant d’un an`alisi relacionat amb comportaments humans, llavors un valor negatiu o anti-correlacionat no ´es inicialment es- perable en aquest estudi. Per tal de veure els comportaments m´es representatius de cada cas, despr´es de la representaci´o de la matriu anterior, es presentar`a una comparaci´o entre patrons corresponents al m´ınim i al m`axim de correlacions per tal de veure les difer`encies i similituds m´es notables.

En segon lloc es pretenen analitzar els despla¸caments temporals entre els patrons de l’apartat 3.1. Es calcular`a el propi despla¸cament temporal, a partir de permutacions c´ıcliques de les series de dades, que fa que les correlacions siguin m`aximes, tal i com est`a especificat a la secci´o de Metodologia. Amb `anim d’optimitzar l’espai, i aprofitant que les matrius de correlacions m`aximes s´on sim`etriques i les de despla¸caments s´on an- tisim`etriques, es representar`a a la part diagonal superior els valors corresponents a les correlacions m`aximes, i a la part diagonal inferior, amb valors assenyalats en color blau, els despla¸caments temporals, mitjan¸cant el n´umero de la permutaci´o c´ıclica, comptabil- itzats en intervals de mitja hora.

S’ha de tenir en compte que a l’hora de calcular aquests despla¸caments temporals, si s’agafen dues ciutats ii j, si la corresponent correlaci´o ´es m`axima quan s’avan¸ca el patr´o de la ciutatj un nombre dex-intervals, aquest despla¸cament ser`a el mateix quan es calcula entre les ciutats j i i, per`o en aquest ´ultim cas, retardant el patr´o d’i el mateix nombre d’intervals. Per tal de visualitzar un exemple s’exposa, el cas de correlaci´o m`axima entre les ciutats de Barcelona i Amsterdam al per´ıode de dilluns a divendres a l’horari d’hivern (Taula 3). En aquest cas, Amsterdam es avan¸cat dos intervals de mitja hora respecte Barcelona, per`o si es volgu´es deixar Amsterdam fixe, el patr´o de Barcelona s’hauria de retardar un hora, que correspon a la permutaci´o c´ıclica 46. ´Es a dir, si represent´essim la matriu de despla¸caments, aquesta seria anisom`etrica. La diagonal seria 0, i si A va avan¸cat una hora respecte de B, B va retardat una hora respecte de A. Finalment, cal notar que la diagonal d’aquestes matrius tornar`a a ser completada amb valor iguals a 1, ja que es consideren les correlacions m`aximes, implicant un valor igual a 0 de cara als despla¸caments temporals ja que s’est`a parlant de la relaci´o d’un ciutat amb ella mateixa.

En tercer lloc, i amb la intenci´o de confirmar que els patrons d’activitat de les difer- ents ciutats amb les correlacions m`aximes tenen un comportament similar de cara als despla¸caments temporals realitzats, es presenten les Figures 5, 7, 9 i 11. Cadascuna de elles presenta tres panells, on estan dividits segons els comportament que segueixen. Al primer panell es troben patrons d’activitat que tenen pics molt pronunciats i, per tant, tenen comportaments m´es bruscs. Al central estaran representats els patrons m´es con- stants o homogenis, i al de la dreta aquells que no tenen una conducta tan clarament definida, de manera que tenen caracter´ıstiques de les dues primeres gr`afiques.

A continuaci´o es presenta aquest an`alisi de dades pels quatre casos que hem considerat durant l’apartat 3.1, espec´ıficament: els comportaments dels patrons d’activitat de dilluns a divendres i, de dissabte i diumenge, per les estacions d’hivern i estiu.

(17)

3.2.2 Correlacions entre patrons d’activitat: de dilluns a divendres, a l’horari d’hivern.

Es passa a tractar les correlacions i despla¸caments temporals que fan que aquestes siguin m`aximes entre les s`eries de dades de dilluns a divendres a l’horari d’hivern per cadascuna de les ciutats.

AMS BCN Berl´ın BRS Dubl´ın Lisboa Londres Madrid Mil`a Paris Roma ESTC Amsterdam 1.000 0.934 0.938 0.925 0.666 0.430 0.871 0.748 0.924 0.646 0.832 0.928 Barcelona 0.934 1.000 0.952 0.941 0.837 0.686 0.957 0.917 0.983 0.821 0.954 0.968 Berl´ın 0.938 0.952 1.000 0.895 0.830 0.620 0.958 0.813 0.952 0.716 0.886 0.925 Brussel·les 0.925 0.941 0.895 1.000 0.761 0.576 0.881 0.833 0.957 0.862 0.931 0.975 Dubl´ın 0.666 0.837 0.830 0.761 1.000 0.900 0.928 0.890 0.854 0.845 0.889 0.823 Lisboa 0.430 0.686 0.620 0.576 0.900 1.000 0.796 0.823 0.690 0.823 0.769 0.666 Londres 0.871 0.957 0.958 0.881 0.928 0.796 1.000 0.896 0.959 0.823 0.934 0.939 Madrid 0.748 0.917 0.813 0.833 0.890 0.823 0.896 1.000 0.907 0.868 0.954 0.889 Mil`a 0.924 0.983 0.952 0.957 0.854 0.690 0.959 0.907 1.000 0.851 0.972 0.977 Paris 0.646 0.821 0.716 0.862 0.845 0.823 0.823 0.868 0.851 1.000 0.921 0.868 Roma 0.832 0.954 0.886 0.931 0.889 0.769 0.934 0.954 0.972 0.921 1.000 0.958 Estocolm 0.928 0.968 0.925 0.975 0.823 0.666 0.939 0.889 0.977 0.868 0.958 1.000

Taula 2: Matriu de correlacions: de dilluns a divendres, a l’horari d’hivern. Mitjana de 0.87. M´ınim i m`axim assenyalats en vermell.

Els casos de les ciutats amb major i menor ´ındex de correlaci´o s´on les existents entre Barcelona i Mil`a amb un valor 0.983, i entre Amsterdam i Lisboa amb un valor de 0.430.

Figura 4: Patrons d’activitat a twitter normalitzats per la parella de ciutats amb menor correlaci´o, Amsterdam i Lisboa, al panell de l’esquerra, i per la parella de ciutats amb major correlaci´o, Barcelona i Mil`a, al panell de la dreta.”.

La matriu de correlacions m`aximes i despla¸caments temporals associada a aquest cas d’estudi es presenta a continuaci´o.

(18)

AMS BCN Berl´ın BRS Dubl´ın Lisboa Londres Madrid Mil`a Paris Roma ESTC Amsterdam 1.000 0.959 0.982 0.925 0.949 0.848 0.986 0.865 0.959 0.766 0.905 0.950 Barcelona 2.0 1.000 0.952 0.953 0.965 0.900 0.973 0.940 0.983 0.826 0.954 0.968 Berl´ın 2.0 0.0 1.000 0.899 0.938 0.832 0.963 0.851 0.952 0.765 0.891 0.925 BRUSS 0.0 47.0 47.0 1.000 0.960 0.951 0.963 0.922 0.973 0.921 0.961 0.979 Dubl´ın 4.0 3.0 3.0 3.0 1.000 0.908 0.965 0.936 0.978 0.865 0.964 0.969

Lisboa 5.0 3.0 4.0 4.0 1.0 1.000 0.893 0.923 0.923 0.962 0.955 0.953

Londres 2.0 1.0 1.0 2.0 47.0 46.0 1.000 0.896 0.980 0.823 0.934 0.975

Madrid 3.0 1.0 2.0 2.0 46.0 46.0 0.0 1.000 0.949 0.871 0.979 0.926

Mil`a 1.0 0.0 0.0 1.0 45.0 45.0 47.0 47.0 1.000 0.870 0.974 0.977

Paris 3.0 1.0 2.0 2.0 47.0 46.0 0.0 47.0 1.0 1.000 0.921 0.900

Roma 2.0 0.0 1.0 1.0 46.0 45.0 0.0 47.0 1.0 0.0 1.000 0.967

Estocolm 1.0 0.0 0.0 1.0 45.0 44.0 47.0 46.0 0.0 47.0 47.0 1.000

Taula 3: Matriu de correlacions m`aximes (diagonal superior en negre) i en quin de- spla¸cament es troben (diagonal inferior en blau): de dilluns a divendres, a l’horari d’hivern.

La mitjana de correlacions m`aximes ´es de 0.93. M`axim i m´ınim assenyalats en vermell.

De cara a la classificaci´o de patrons d’activitat segons el comportament adquirit, es presenta la seg¨uent figura formada per tres gr`afics associats a la discretitzaci´o esmentada a l’apartat 3.2.1.

Figura 5: Patrons d’activitat a twitter normalitzats i despla¸cats per les ciutats d’Amsterdam, Londres, Berl´ın, Lisboa, Brussel·les i Estocolm pel per´ıode de dilluns a divendres amb l’horari d’hivern. Els intervals despla¸cats estan a la llegenda, per exemple, Amsterdam [2] vol dir que l’activitat d’aquesta ciutat ha estat despla¸cats dos intervals de mitja hora, per tant, estan avan¸cats una hora. En canvi, Lisboa [44] vol dir que el seu patr´o est`a retardat dues hores.

3.2.3 Correlacions entre patrons d’activitat: de dilluns a divendres, a l’horari d’estiu.

Es passa a tractar les correlacions i despla¸caments temporals que fan que aquestes siguin m`aximes entre les s`eries de dades de dilluns a divendres a l’horari d’estiu per cadascuna de les ciutats. La matriu de correlacions corresponent es presenta a la Taula 4.

Els casos de les ciutats amb major i menor ´ındex de correlaci´o s´on les existents entre Brussel·les i Estocolm amb un valor 0.988, i entre Amsterdam i Lisboa amb un valor de 0.298. Cal destacar que existeix un altre m`axim de correlaci´o amb valor similar a l’anterior i correspon a les ciutats de Barcelona i Roma amb un ´ındex de 0.987.

(19)

AMS BCN Berl´ın BRS Dubl´ın Lisboa Londres Madrid Mil`a Paris Roma ESTC Amsterdam 1.000 0.908 0.960 0.959 0.826 0.298 0.944 0.816 0.926 0.813 0.918 0.975 Barcelona 0.908 1.000 0.927 0.948 0.910 0.614 0.969 0.944 0.980 0.960 0.987 0.935 Brl´ın 0.960 0.927 1.000 0.927 0.902 0.444 0.966 0.835 0.949 0.861 0.944 0.951 Brussel·les 0.959 0.948 0.927 1.000 0.846 0.413 0.943 0.858 0.957 0.900 0.947 0.988 Dubl´ın 0.826 0.910 0.902 0.846 1.000 0.727 0.940 0.917 0.935 0.924 0.949 0.854 Lisboa 0.298 0.614 0.444 0.413 0.727 1.000 0.582 0.727 0.600 0.751 0.621 0.380 Londres 0.944 0.969 0.966 0.943 0.940 0.582 1.000 0.918 0.986 0.939 0.980 0.953 Madrid 0.816 0.944 0.835 0.858 0.917 0.727 0.918 1.000 0.925 0.935 0.952 0.834 Mil`a 0.926 0.980 0.949 0.957 0.935 0.600 0.986 0.925 1.000 0.964 0.986 0.953 Paris 0.813 0.960 0.861 0.900 0.924 0.751 0.939 0.935 0.964 1.000 0.957 0.878 Roma 0.918 0.987 0.944 0.947 0.949 0.621 0.980 0.952 0.986 0.957 1.000 0.942 Estocolm 0.975 0.935 0.951 0.988 0.854 0.380 0.953 0.834 0.953 0.878 0.942 1.000

Taula 4: Matriu de correlacions per les dades de dilluns a divendres a l’horari d’estiu.

La mitjana de correlacions ´es de 0.878. M`axim i m´ınim assenyalats en vermell.

Figura 6: Patrons d’activitat a twitter per la parella de ciutats amb menor correlaci´o, Amsterdam i Lisboa, al panell de l’esquerra, i per les parelles de ciutats amb major correlaci´o, Brussel·les i Estocolm al panell central i Barcelona i Roma al panell de la dreta.

La matriu de correlacions m`aximes i despla¸caments temporals corresponent a aquest cas ´es la seg¨uent.

AMS BCN Berl´ın BRS Dubl´ın Lisboa Londres Madrid Mil`a Paris Roma ESTC Amsterdam 1.000 0.945 0.975 0.959 0.983 0.799 0.987 0.900 0.969 0.913 0.970 0.975 Barcelona 2.0 1.000 0.927 0.967 0.956 0.893 0.969 0.962 0.980 0.960 0.987 0.965 Berl´ın 2.0 0.0 1.000 0.927 0.967 0.790 0.966 0.875 0.949 0.895 0.944 0.953 Brussel·les 0.0 46.0 0.0 1.000 0.968 0.887 0.977 0.934 0.984 0.971 0.978 0.988 Dubl´ın 4.0 2.0 2.0 3.0 1.000 0.822 0.976 0.927 0.977 0.932 0.976 0.977

Lisboa 7.0 4.0 6.0 6.0 3.0 1.000 0.839 0.858 0.884 0.957 0.876 0.895

Londres 2.0 0.0 0.0 2.0 46.0 44.0 1.000 0.927 0.986 0.941 0.980 0.982

Madrid 3.0 1.0 2.0 2.0 47.0 45.0 1.0 1.000 0.948 0.935 0.965 0.925

Mil`a 2.0 0.0 0.0 1.0 46.0 44.0 0.0 47.0 1.000 0.969 0.986 0.984

Paris 3.0 0.0 2.0 2.0 47.0 45.0 1.0 0.0 1.0 1.000 0.957 0.967

Roma 2.0 0.0 0.0 2.0 46.0 44.0 0.0 47.0 0.0 0.0 1.000 0.983

Estocolm 0.0 46.0 47.0 0.0 45.0 42.0 46.0 45.0 46.0 46.0 46.0 1.000

Taula 5: Matriu de correlacions m`aximes (diagonal superior en negre) i en quin de- spla¸cament temporal es troben (diagonal inferior en blau) per les dades de dilluns a divendres a l’horari d’estiu. La mitjana de correlacions m`aximes ´es de 0.948. M`axim i m´ınim assenyalats en vermell.

De cara a la classificaci´o de patrons d’activitat segons el comportament adquirit, es presenta la seg¨uent figura formada per tres gr`afics associats a la discretitzaci´o esmentada a l’apartat 3.2.1.

(20)

Figura 7: Patrons d’activitat a twitter normalitzats i despla¸cats pel per´ıode de dilluns a divendres amb l’horari d’estiu. Els intervals despla¸cats estan a la llegenda, seguit el mateix criteri que a la Figura 5.

3.2.4 Correlacions entre patrons d’activitat: dissabtes i diumenges, a l’horari d’hivern.

A continuaci´o ´es mostren els resultats del tractament fet per les s`eries de dades dels caps de setmana a l’horari d’hivern. Seguint el procediment dels apartats anteriors, s’obtenen els seg¨uents resultats. La matriu de correlacions corresponent es presenta a la Taula 6.

AMS BCN Berl´ın BRS Dubl´ın Lisboa Londres Madrid Mil`a Paris Roma ESTC Amsterdam 1.000 0.951 0.944 0.959 0.742 0.471 0.935 0.830 0.964 0.776 0.893 0.937 Barcelona 0.951 1.000 0.982 0.992 0.879 0.684 0.980 0.942 0.988 0.918 0.968 0.981 Berl´ın 0.944 0.982 1.000 0.980 0.904 0.673 0.990 0.911 0.982 0.885 0.960 0.988 Brussel·les 0.959 0.992 0.980 1.000 0.867 0.662 0.979 0.925 0.994 0.916 0.966 0.985 Dubl´ın 0.742 0.879 0.904 0.867 1.000 0.878 0.928 0.919 0.865 0.909 0.905 0.912 Lisboa 0.471 0.684 0.673 0.662 0.878 1.000 0.712 0.837 0.628 0.851 0.698 0.687 Londres 0.935 0.980 0.990 0.979 0.928 0.712 1.000 0.935 0.982 0.904 0.964 0.991 Madrid 0.830 0.942 0.911 0.925 0.919 0.837 0.935 1.000 0.911 0.960 0.932 0.921 Mil`a 0.964 0.988 0.982 0.994 0.865 0.628 0.982 0.911 1.000 0.896 0.973 0.988 Paris 0.776 0.918 0.885 0.916 0.909 0.851 0.904 0.960 0.896 1.000 0.936 0.912 Roma 0.893 0.968 0.960 0.966 0.905 0.698 0.964 0.932 0.973 0.936 1.000 0.981 Estocolm 0.937 0.981 0.988 0.985 0.912 0.687 0.991 0.921 0.988 0.912 0.981 1.000

Taula 6: Matriu de correlacions de dissabtes i diumenges amb l’horari d’hivern. Mitjana de 0.905. M´ınim i m`axim assenyalats en vermell.

Figura 8: Patrons d’activitat a twitter normalitzats per per la parella de ciutats amb menor correlaci´o, Amsterdam i Lisboa, al panell de l’esquerra, i per la parella de ciutats amb major correlaci´o, Mil`a i Brussel·les, al panell de la dreta.

(21)

La matriu de correlacions m`aximes i de despla¸caments temporals es presenta a la continuaci´o. A m´es, tamb´e es presenta la classificaci´o de patrons d’activitat segons el comportament adquirit a partir del tipus de conductes de l’apartat 3.2.1.

AMS BCN Berl´ın BRS Dubl´ın Lisboa Londres Madrid Mil`a Paris Roma ESTC Amsterdam 1.000 0.979 0.979 0.975 0.970 0.867 0.989 0.944 0.978 0.888 0.938 0.974 Barcelona 2.0 1.000 0.982 0.992 0.977 0.925 0.980 0.970 0.988 0.939 0.968 0.981 Berl´ın 2.0 0.0 1.000 0.980 0.985 0.901 0.990 0.935 0.982 0.908 0.960 0.988 Brussel·les 1.0 0.0 0.0 1.000 0.982 0.936 0.984 0.973 0.994 0.949 0.966 0.985 Dubl´ın 5.0 3.0 3.0 3.0 1.000 0.912 0.987 0.937 0.988 0.928 0.972 0.989

Lisboa 6.0 4.0 4.0 4.0 2.0 1.000 0.901 0.929 0.926 0.987 0.941 0.929

Londres 2.0 0.0 0.0 1.0 46.0 44.0 1.000 0.945 0.992 0.915 0.964 0.991

Madrid 3.0 1.0 1.0 2.0 47.0 46.0 1.0 1.000 0.966 0.960 0.958 0.948

Mil`a 1.0 0.0 0.0 0.0 45.0 43.0 47.0 46.0 1.000 0.945 0.979 0.991

Paris 3.0 1.0 2.0 2.0 47.0 45.0 1.0 0.0 2.0 1.000 0.959 0.938

Roma 2.0 0.0 0.0 0.0 46.0 44.0 0.0 47.0 1.0 47.0 1.000 0.981

Estocolm 2.0 0.0 0.0 0.0 45.0 44.0 0.0 47.0 1.0 47.0 0.0 1.000

Taula 7: Matriu de correlacions m`aximes (diagonal superior en negre) i en quin de- spla¸cament temporal es troben (diagonal inferior en blau) per les dades de dissabtes i diumenges a l’horari d’hivern. La mitjana de correlacions m`aximes ´es de 0.963. M`axim i minim assenyalats en vermell.

Figura 9: Patrons d’activitat a twitter normalitzats i despla¸cats temporalment pel per´ıode amb horari d’estiu dels caps de setmana. El despla¸cament de cada patr´o ´es troba a la llegenda, seguint el mateix criteri de la Figura 5.

3.2.5 Correlacions entre els patrons d’activitat: dissabtes i diumenges a l’horari d’estiu.

Els resultats de l’an`alisi realitzat per les s`eries de dades de dissabtes i diumenges amb l’horari d’estiu s´on els seg¨uents. La matriu de correlacions corresponent es presenta a la Taula 8.

(22)

AMS BCN Berl´ın BRS Dubl´ın Lisboa Londres Madrid Mil`a Paris Roma ESTC Amsterdam 1.000 0.917 0.961 0.970 0.868 0.384 0.969 0.834 0.949 0.862 0.935 0.988 Barcelona 0.917 1.000 0.964 0.977 0.943 0.649 0.967 0.943 0.980 0.970 0.986 0.944 Berl´ın 0.961 0.964 1.000 0.982 0.946 0.555 0.987 0.895 0.974 0.918 0.966 0.984 Brussel·les 0.970 0.977 0.982 1.000 0.935 0.544 0.995 0.906 0.995 0.949 0.987 0.987 Dubl´ın 0.868 0.943 0.946 0.935 1.000 0.742 0.952 0.941 0.938 0.937 0.939 0.922 Lisboa 0.384 0.649 0.555 0.544 0.742 1.000 0.554 0.803 0.573 0.726 0.585 0.471 Londres 0.969 0.967 0.987 0.995 0.952 0.554 1.000 0.904 0.990 0.942 0.981 0.991 Madrid 0.834 0.943 0.895 0.906 0.941 0.803 0.904 1.000 0.914 0.954 0.918 0.869 Mil`a 0.949 0.980 0.974 0.995 0.938 0.573 0.990 0.914 1.000 0.966 0.991 0.974 Paris 0.862 0.970 0.918 0.949 0.937 0.726 0.942 0.954 0.966 1.000 0.966 0.898 Roma 0.935 0.986 0.966 0.987 0.939 0.585 0.981 0.918 0.991 0.966 1.000 0.960 Estocolm 0.988 0.944 0.984 0.987 0.922 0.471 0.991 0.869 0.974 0.898 0.960 1.000

Taula 8: Matriu de correlacions de dissabtes i diumenges amb l’horari d’estiu, Mitjana de correlacions 0.899. M`axim i m´ınim assenyalats en vermell.

Els casos de les ciutats amb major i menor ´ındex de correlaci´o s´on les existents entre Londres, Mil`a i Brussel·les amb un valor 0.995, i entre Amsterdam i Lisboa amb un valor de 0.384.

Figura 10: Patrons d’activitat a twitter normalitzats per per la parella de ciutats amb menor correlaci´o, Amsterdam i Lisboa, al panell de l’esquerra, i per les tres de ciutats amb major correlaci´o, Mil`a, Brussel·les i Londres, al panell de la dreta.

AMS BCN Berl´ın BRS Dubl´ın Lisboa Londres Madrid Mil`a Paris Roma ESTC Amsterdam 1.000 0.949 0.978 0.977 0.986 0.836 0.985 0.931 0.966 0.922 0.952 0.990 Barcelona 2.0 1.000 0.964 0.977 0.965 0.927 0.967 0.976 0.980 0.970 0.986 0.952 Berl´ın 2.0 0.0 1.000 0.982 0.988 0.871 0.987 0.935 0.974 0.926 0.966 0.984 Brussel·les 1.0 0.0 0.0 1.000 0.989 0.913 0.995 0.966 0.995 0.967 0.987 0.987 Dubl´ın 4.0 2.0 2.0 2.0 1.000 0.877 0.991 0.941 0.979 0.937 0.975 0.989

Lisboa 7.0 4.0 6.0 6.0 4.0 1.000 0.900 0.905 0.935 0.964 0.935 0.868

Londres 2.0 0.0 0.0 0.0 46.0 42.0 1.000 0.946 0.990 0.956 0.981 0.992

Madrid 3.0 2.0 2.0 2.0 0.0 45.0 2.0 1.000 0.970 0.966 0.967 0.932

Mil`a 1.0 0.0 0.0 0.0 46.0 43.0 0.0 46.0 1.000 0.982 0.991 0.978

Paris 2.0 0.0 2.0 1.0 47.0 44.0 1.0 47.0 1.0 1.000 0.979 0.935

Roma 2.0 0.0 0.0 0.0 46.0 43.0 0.0 46.0 0.0 47.0 1.000 0.963

Estocolm 1.0 47.0 0.0 0.0 45.0 42.0 47.0 46.0 47.0 46.0 47.0 1.000

Taula 9: Matriu de correlacions m`aximes (diagonal superior en negre) i en quin de- spla¸cament temporal es troben (diagonal inferior en blau) per les series de dades de dissabtes i diumenges amb l’horari d’estiu. Mitjana de 0.962. M`axim i m´ınim assenyalats en vermell.

Per ´ultim es presenta la ´ultima classificaci´o de patrons d’activitat segons el compor- tament adquirit a partir del tipus de conductes de l’apartat 3.2.1.

(23)

Figura 11: Patrons d’activitat a twitter normalitzats i despla¸cats pel per´ıode de caps de setmana amb l’horari d’estiu. Els despla¸caments es troben a les llegendes, seguint el criteri de la Figura 5.

4 An` alisis i disccusi´ o dels resultats

4.1 Interpretaci´ o de resultats.

L’objectiu d’aquest apartat ´es la interpretaci´o de l’an`alisi realitzat a les seccions an- teriors. S’analitzen les principals caracter´ıstiques generalitzades a tots el casos, posant

`

emfasi en certs aspectes diferenciadors essencials.

Pel que fa a les matrius de correlacions (Taules 2, 4, 6 i 8), els quatre casos tenen en com´u que els patrons que m´es difereixen entre s´ı i, en conseq¨u`encia, menor correlaci´o tenen, s´on els de les ciutats d’Amsterdam i Lisboa. Aquests estan representats a les Figures 4, 6, 8 i 10, en les quals podem apreciar que els patrons d’aquestes ciutats tenen un despla¸cament temporal de gaireb´e tres hores. Aquest fet no ´es caracter´ıstic de si s´on dies laborals o no, ni de si ´es estiu o hivern, per tant, mostra que l’activitat a la xarxa social ´es veu afectada pel cicle solar de cada regi´o. A m´es, aquestes mostren una evoluci´o distinta. L’activitat a la xarxa social a Amsterdam ´es considerablement homog`enia durant tot el dia, en canvi, l’activitat a Lisboa arriba a un m`axim local del nombre de tweets escrits al mat´ı, seguit d’una forta disminuci´o al migdia, per acabar amb un gran augment a un m`axim global a la tarda. Per tant, es poden diferenciar dos tipus de patrons distints i, el que es realitzar`a a continuaci´o, ´es veure si la resta de ciutats es comporten de manera similar a aquestes dues formes d’activitat.

Respecte als m`axims de les matrius de correlaci´o, encara que varien una mica d’un per´ıode als altres, sempre es mantenen m´es correlacionats els patrons de les ciutats de Mil`a, Brussel·les i Londres. Les Figures 4 i 6 mostren com els patrons d’aquestes ciutats, als dies laborables, ´es comporten seguint l’estil explicat per la ciutat de Lisboa, per`o sense fer variacions tan pronunciades. En canvi, com podem veure a la Figura 10, els dissabtes i diumenges a l’horari d’estiu tenen un patr´o d’activitat m´es homogeni i, per tant, m´es similar a l’explicat per la ciutat d’Amsterdam.

Pel que fa a les matrius de correlacions m`aximes i els seus despla¸caments (Taules 3, 5, 7 i 9), totes tenen en com´u que la ciutat que m´es augmenta les seves correlacions quan tenim en compte possibles despla¸caments temporals ´es Lisboa. Si ens fixem, per exemple, a la Taula 7, la correlaci´o entre l’activitat a Amsterdam i Lisboa arriba a ser de 0.867 quan s’avan¸ca l’activitat d’Amsterdam 3 hores. Anteriorment s’han comentat les discrep`ancies

Referanser

RELATERTE DOKUMENTER

D’acord amb aquesta idea entenem que l’educació matemàtica dins l’aula des d’una perspectiva cultural i social, requereix d’unes activitats matemàtiques que

“Si fem la mesura de la longitud de l’ombra a la mateixa hora però amb un altre obelisc més curt, la seva ombra també hagués estat més curta?”.. Que penses que li va respondre

A més, aquesta ideologia anticlerical servirà de nexe d’unió entre el primer republicanisme de Llucmajor i el socialisme posterior, i també pot ajudar a entendre el

S'apropa el final de la carrera, allò que va començar sent un somni des de petit veig com a poc a poc va camí de convertir-se en una realitat. Han estat 4 anys molt intensos en

Es por ello que la salud es un fenómeno social que sólo puede ser explicado teniendo en cuenta que se trata de una estructura de alto grado de complejidad como son los hechos

El tutor explicarà als alumnes que amb la sessió d' avui ja s' haurà acabat el programa per a la millora de la Intel·ligència Emocional i amb l' objectiu de saber un poc més sobre

1) Identificar les espècies macrofítiques presents actualment al Parc Natural de l’Albufera de Mallorca visibles a simple vista, per tal de determinar si la presència d’aquestes

Al parecer, la mayoría coinciden en estar situados en cavernas, sin embargo, la posición de algunos y los ajuares que les acompañan proporcionan más detalles acerca de