Página anterior Voltar ao início do trabalhoPágina seguinte 


Desenvolvimento nos Países de Língua Oficial Portuguesa (página 3)

José Alberto Afonso Alexandre
Partes: 1, 2, 3

11 - CTI

-.43342

1.19580

-.06657

12 - TCPU

-.66878

-.12037

-.00456

13 - TCPA

-.02927

-.71687

.00465

14 - ELECTR

-.64543

1.40024

-.09538

15 - CO2

-.88947

1.74889

-.26142

 

Figura 2 - relação entre as variáveis e os componentes no espaço rodado

Figura 3 - relação entre as variáveis e os componentes no espaço rodado

2.2.7 - Scores proporcionais à importância dos componentes

Relativamente ao agrupamento ou classificação dos países, observando os Quadros XIII e XIV, que apresentam, respectivamente, os scores proporcionais à importância dos componentes e os scores padronizados, e recorrendo-nos da análise da Figura 4, Portugal apresenta scores mais elevados e de forma destacada no Componente_2, que, como foi dito, é o componente do consumo.

Quadro xiii - scores proporcionais a importância dos componentes

Componente_1

Componente_2

Componente_3

Portugal

2.78

12.30

-0.09

Brasil

7.69

-0.21

1.10

Cabo Verde

2.48

-3.51

1.13

São Tomé

7.72

-5.74

-1.73

Angola

-7.09

-0.33

-2.05

Guiné Bissau

-6.37

-0.05

-0.54

Moçambique

-7.20

-2.46

2.17

Quadro xiv - scores padronizados

Componente_1

Componente_2

Componente_3

Portugal

0,41042

2,11574

-0,05566

Brasil

1,13497

-0,03547

0,70249

Cabo Verde

0,36560

-0,60343

0,72179

São Tomé

1,13966

-0,98753

-1,10370

Angola

-1,04709

-0,05669

-1,30999

Guiné Bissau

-0,94105

-0,00866

-0,34411

Moçambique

-1,06251

-0,42396

1,38917

Os restantes países podem ser divididos em dois grupos, com características internas ainda bem distintas, um englobando o Brasil, Cabo Verde e São Tomé e Príncipe, e o outro englobando Angola, Guiné-Bissau e Moçambique, tal como se pode concluir a partir da análise da Figura 4.

Figura 4 - relação entre os países e os componentes no espaço rodado

Convém referir o facto de Moçambique apresentar elevados scores no Componente_3, que se explica pelos valores elevados de população infectada pelo virús HIV.

Concluindo: três grupos de países:

    • Moçambique + Guiné + Angola
    • São Tomé + Cabo Verde + Brasil
    • Portugal

No capítulo seguinte continuaremos e aprofundaremos este assunto, para tal recorrendo a outra técnica de classificação: as toxonomias numéricas.

II - Taxonomias numéricas

2.1 - Aspectos gerais

2.2 - Estratégias de classificação

2.3 - Processo de classificação

2.1 - Aspectos gerais

Quando se analisa o universo das unidades de análise, o objectivo fundamental é o de procurar a semelhança (ou a distância) entre as unidades de análise de modo a perceber como é que se agrupam, ou por que é que se agrupam, face aos valores que têm nas respectivas variáveis.

Quando o objectivo é conhecer o modo como se agrupam as unidades de análise, utilizam-se as técnicas de classificação ou taxonomias numéricas.

Este processo de procurar as proximidades entre as unidades de análise é o equivalente à análise dos diagramas de dispersão, mas se nestes apenas é possível considerar dois eixos no gráfico, a que correspondem só duas variáveis, as taxonomias numéricas podem considerar mais do que duas variáveis. Para isso é necessário que as variáveis sejam comparáveis.

As taxonomias numéricas têm por objectivo agrupar os indivíduos num número restrito de classes homogéneas. Trata-se, então, de descrever os dados procedendo a uma redução do número de indivíduos.

As classes são obtidas por meio de algoritmos formalizados e não por métodos subjectivos ou visuais fazendo apelo à iniciativa do investigador.

Distinguem-se dois grandes tipos de métodos de classificação:

  1. Os métodos não hierárquicos, que produzem directamente uma divisão num número fixo de classes;
  2. Os métodos hierárquicos, que produzem várias divisões em classes cada vez mais vastas (como por exemplo, as classificações utilizadas em biologia).

Existem, assim, diversos métodos, mas todos eles procuram organizar as unidades de análise em grupos ou classes. As técnicas hierárquicas são as mais aplicadas.

2.2 - Estratégias de classificação

Dentro dos métodos de classificação existem muitas alternativas.

A primeira questão a ser formulada é que o propósito é identificar agrupamentos distintos ou «naturais» de indivíduos e o que poderia ser chamado um bem-estruturado conjunto de dados, ou dividir um grupo de uma forma mais arbitrária, em que é uma colecção homogénea de indivíduos.

Convém distinguir ordenação (ou ordenamento န subdivisão num conjunto homogéneo) de classificação (em que distintos grupos são definidos).

Adicionalmente, estes métodos podem ser quantitativos ou qualitativos. A classificação qualitativa frequentemente procede por definição como, por exemplo, no caso de segmentos de um rio que podem ser colocados em classes de acordo com alguma definição à priori.

A classificação quantitativa, no entanto, mais frequentemente procede pela enumeração dos atributos de um conjunto de indivíduos, usando as numerações para determinar os membros mais semelhantes do conjunto.

Os grupos podem ser formados pela divisão lógica de um conjunto completo, que envolve gradualmente a divisão do conjunto em grupos cada vez mais pequenos até que só os indivíduos isolados são deixados; ou o processo pode ser aglomerativo em que os indivíduos formam o ponto de partida e são sucessivamente agrupados até que todos são incluídos num amplo grupo.

Ambas as estratégias são hierárquicas, com grupos de vários tamanhos que se encontram a diferentes níveis. Nesta conexão existe o problema em determinar a que nível de integração ou de desintegração a selecção dos grupos deve ser feita. Se a selecção é muito próxima de um grupo grande então serão feitos muitos pequenos grupos e uma consequente perda de informação e detalhe. Por outro lado, a terminação muito próxima do indivíduo acaba com as causas hierárquicas e generalidades importantes e identidades grupais podem-se perder devido à super-abundância de pequenos grupos.

2.3 - Processo de classificação

Após a apresentação das estratégias de classificação apresentam-se algumas tácticas através das quais aquelas estratégias são acompanhadas.

Quadro xv - matriz de atributos (países de língua portuguesa)

Variáveis

EMV

TAA

TEB

PIB

PIB1

TMI

PATS

TMG

SIDA

RADIO

CTI

TCPU

TCAP

ELECT

CO2

Casos

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

1 - Portugal

74,8

89,6

81

12674

6171

7

99

18

7,3

245

30,2

1,3

-0,1

3482

5,3

2 - Brasil

66,6

83,3

72

5928

5928

44

88

13

10,0

399

13,0

1,6

1,1

1954

1,6

3 - Cabo Verde

65,7

71,6

64

2612

2612

54

30

12

8,9

179

10,0

3,7

2,1

55

0,3

4 - São Tomé

69,0

75,0

57

1744

1744

62

86

4

3,0

271

4,2

3,2

1,8

96

0,6

5 - Angola

47,4

42,0

30

1839

1839

170

15

6

1,0

34

1,7

4,9

3,1

173

0,4

6 - Guiné Bissau

43,4

54,9

29

811

811

132

27

12

3,4

42

2,1

4,0

2,0

40

0,2

7 - Moçambique

46,3

40,1

25

959

959

133

25

13

12,6

38

0,9

4,7

2,5

67

0,1

Partindo-se duma matriz de atributos (Quadro XV), em que existem uma série de dados correspondentes aos valores das variáveis nos vários países (casos ou unidades de análise), constroi-se uma matriz de distâncias entre os países (Quadro XVI).

Quadro xvi - matriz de distâncias euclideanas (inicial)

 

Portugal

Brasil

Cabo Verd

S. Tomé

Angola

Guiné-Biss

Moçambiq

Portugal

0

6923

11210

12269

12133

13468

13272

Brasil

6923

0

5065

6203

6064

7495

7286

Cabo Ver

11210

5065

0

1233

1116

2552

2344

S. Tomé

12269

6203

1233

0

315

1344

1140

Angola

12133

6064

1116

315

0

1461

1250

Guiné-B

13468

7495

2552

1344

1461

0

212

Moçamb

13272

7286

2344

1140

1250

212

0

De seguida, agrupam-se estes, com base em critérios de semelhança, considerando que estão mais próximos, e por isso, devem pertencer ao mesmo grupo ou classe os países que têm valores mais aproximados nas diversas variáveis.

Estas localizações determinam, por seu lado, as distâncias estatísticas (não geográficas) entre os países, e podem ser calculadas por uma aplicação do teorema de Pitágoras. Em termos geométricos, a distância entre os dois Estados é o comprimento da hipotenusa do triângulo rectângulo definido pela localização no gráfico dos dois Estados. Os comprimentos dos outros dois lados do triângulo dependem das diferenças entre os dois valores em cada um dos eixos. A distância D é dada por:

Em que:

X1i = scores individuais i na variável 1

X1j = scores individuais j na variável 1

X2i = scores individuais i na variável 2

X2j = scores individuais j na variável 2

Dij = distância estatística entre i e j

Este cálculo repete-se para todos os pares de indivíduos e a matriz de distâncias (ou semelhança) pode ser construída.

Desta maneira as distâncias são medidas de semelhança, quanto mais pequena for a distância maior é a semelhança. Através da matriz podemos determinar quais os membros que estão mais próximos para formar um grupo. A partir do Quadro XVI, Guiné-Bissau e Moçambique foram agrupados, os seus lugares foram tomados por uma nova, e única, medida entre eles (o grupo centróide).

A matriz é agora ordenada de forma decrescente e é recalculada para tomar conta no novo ponto. A matriz recalculada vai buscar o valor menor e o processo de junção e recálculo repete-se. Em cada etapa a ordem da matriz decresce por um e o grupo resultante é presumido o acto como o simples ponto localizado no seu centro geométrico. Nesta posição, o grupo centróide, é determinado a partir da média dos pontos individuais ao longo de cada eixo ou dimensão. Por exemplo, o centro do agrupamento de 5 indivíduos deve ser tomado pelas médias dos indicadores (média da EMV, média do PIB, ဦ).

O objectivo é rapidamente atingido quando a maioria dos indivíduos são integrados num ou noutro dos grupos emergentes. Mas o processo de «fusão» continua com os próprios grupos até que exista um só grupo.

2.3.1 - Metodologia de agrupamento

Duas questões se colocaram:

  • Escolha da classificação hierárquica ou da classificação não hierárquica:

Quando se opta por um método de classificação não hierárquica, é necessário indicar o número de grupos a formar. De facto, poucos programas permitem esta alternativa, por isso, escolhemos a classificação hierárquica.

  • Escolha da classificação hierárquica ascendente ou descendente:

Ao escolher a classificação hierárquica, optámos pela ascendente, pois é a mais utilizada.

2.3.1.1 - Classificação hierárquica

Cada vez que se forma um grupo, este constitui-se por junção (no caso das classificações hierárquicas ascendentes) ou por segmentação (no caso das classificações hierárquicas descendentes) de grupos pré-existentes.

No caso dos métodos ascendentes, o seu princípio consiste em construir uma série de junções em n classes, n-1 classes, n-2 classes, ဦ, embutidas umas nas outras, da maneira seguinte: a partição em k classes é obtida agrupando duas das classes da partição de k+1 classes. Existe então, um total de n-2 partições a determinar uma vez que a partição em n classes é aquela onde cada indivíduo é isolado e a partição numa classe não é outra que a reunião de todos os indivíduos.

Fala-se de classificação hierárquica, ou de hierarquia, quando cada classe de uma partição é incluída numa classe da partição seguinte. A seguinte das partições obtidas é usualmente representada sob a forma análoga à de um organigrama duma empresa (dendograma).

Assim, as classificações hierárquicas formam uma sequência de agrupamentos, ou separações de grupos pré-existentes, numa série que vai de n grupos de um elemento a um único grupo final com n elementos. Esta sequência de classes pode ser visualizada por um gráfico esquemático, a que se dá o nome de árvore de ligação, dendograma ou fenograma.

Os dendogramas mostram, com alguma facilidade, o modo como se efectuam as fusões entre indivíduos ou grupos, e a que nível de proximidade ou semelhança elas se efectuam. No gráfico, a relação com a proximidade é dada pela distância vertical entre a base do gráfico, onde estão identificados os países, e a barra horizontal da união dos grupos.

2.3.2 - Estratégias de agrupamento

Depois de escolher uma medida de distância, constroi-se uma matriz de distâncias entre os países. Como estamos perante uma metodologia de agrupamento hierárquico ascendente, o primeiro passo consiste em determinar quais os dois países mais próximos, e constituir com eles um grupo (Guiné e Moçambique).

Depois refaz-se a matriz, e assim sucessivamente. O problema está em como se mede a distância entre um elemento e um grupo, ou entre dois grupos.

Assim, embora os cálculos não sejam difíceis, são repetitivos e fornecem uma longa sequência de resultados que podem ser resumidos sob a forma de um dendograma. Este é um gráfico em que um eixo lista os países e o outro os níveis a que eles, e os seus consequentes sub-grupos, se fundem. Estes níveis são expressos pelas distâncias entre os grupos ao ponto de fusão. O gráfico é completado pela estrutura de ligações.

2.3.2.1 - Método do vizinho mais próximo (Single Linkage)

Dadas duas classes a e b, a distância entre elas é dada pelo valor mínimo de todas as distâncias entre todos os elementos de a e todos os elementos de b.

Este método gera grupos bastante heterogéneos, com tendência para formar cadeias. Privilegia o facto de fazer classes ou grupos tão distintos internamente, quanto os atributos o permitem.

ESTRUTURA DE LIGAÇÃO

Passo n.º NovoGrupo AntigosElementos Distancia

1 8 6 7 211.871

2 9 4 5 314.891

3 10 3 9 1116.344

4 11 8 10 1139.862

5 12 2 11 5064.583

6 13 1 12 6923.011

Amalgamation Schedule

Single Linkage

Euclidean distances

Passo Passo Passo Passo Passo Passo Passo

1 2 3 4 5 6 7

211,8709 Guiné Moçam ,000 ,000 ,000 ,000 ,000

314,8911 S.Tomé Angola ,000 ,000 ,000 ,000 ,000

1116,344 Cabo V S.Tomé Angola ,000 ,000 ,000 ,000

1139,862 Cabo V S.Tomé Angola Guiné Moçam ,000 ,000

5064,583 Brasil Cabo V S.Tomé Angola Guiné Moçam ,000

6923,011 Portug Brasil Cabo V S.Tomé Angola Guiné Moçamb

Figura 5 - método do vizinho mais próximo (single linkage)

Conhecendo o dendograma, é fácil daí deduzir as partições num número mais ou menos elevado de classes, sendo suficiente, para isso, «cortar» o dendograma a um certo nível e ver quais os «ramos» que tombam. Assim, no nosso exemplo, o primeiro grupo a ser formado consistiu na junção de Moçambique e Guiné, posteriormente juntou-se Angola e São Tomé. A este último grupo de dois países juntou-se um terceiro: Cabo Verde. O passo seguinte consistiu no agrupamento de todos os conjuntos feitos até então, agrupando Cabo Verde, S. Tomé, Angola, Guiné e Moçambique. A este agrupamento juntou-se, posteriormente o Brasil, e por último Portugal (Figura 5).

O principal problema dos métodos de classificação hierárquica consiste na definição do critério de agrupamento de duas classes, o que acarreta a definição de uma distância entre as classes. Todos os algoritmos de classificação hierárquica se desenvolvem da mesma maneira: procura-se em cada etapa as duas classes mais próximas, juntam-se, e continua-se até que não haja mais que uma só classe.

2.3.2.2 - Método do vizinho mais distante (Complete Linkage)

A ligação entre duas classes a e b, é o valor máximo de todas as distâncias entre todos os elementos de a e todos os elementos de b.

Quando se juntam dois grupos, primeiro calculam-se todas as distâncias deste modo, depois, agregam-se os que se encontram à menor distância.

Este método cria grupos muito compactos, que com dificuldade se agregam a outros. Privilegia o facto de fazer grupos tão homogéneos quanto os atributos o permitem.

Amalgamation Schedule

Complete Linkage

Euclidean distances

Passo Passo Passo Passo Passo Passo Passo

1 2 3 4 5 6 7

211,8709 Guiné Bi Moçambiq ,000 ,000 ,000 ,000 ,000

314,8911 São Tomé Angola ,000 ,000 ,000 ,000 ,000

1233,044 Cabo Ver São Tomé Angola ,000 ,000 ,000 ,000

2552,329 Cabo Ver São Tomé Angola Guiné Bi Moçambiq ,000 ,000

6923,011 Portugal Brasil ,000 ,000 ,000 ,000 ,000

13467,57 Portugal Brasil Cabo Ver São Tomé Angola Guiné Bi Moçambiq

Figura 6 - método do vizinho mais distante (complete linkage)

A diferença desta estratégia de agrupamento com a anterior, é que a junção de todos os países se dá a uma distância muito superior, principalmente nos passos mais elevados.

Este método e o anterior dão resultados muito contrastados. Foram, por isso, propostos alguns que procuram a sua conciliação. Em vez de utilizar a menor ou a maior das distâncias de um conjunto usam-se médias dessas distâncias, o que vem a dar uma solução de compromisso entre as duas.

2.3.2.3 - Método da média do grupo (Unweighted pair-group average)

A distância entre duas classes a e b, é a média de todas as distâncias entre todos os elementos de a e todos os elementos de b. Devido à clareza do seu significado, este é o método de agrupamento mais utilizado nas taxonomias numéricas.

Amalgamation Schedule

Unweighted pair-group average

Euclidean distances

Passo Passo Passo Passo Passo Passo Passo

1 2 3 4 5 6 7

211,8709 Guiné Bi Moçambiq ,000 ,000 ,000 ,000 ,000

314,8911 São Tomé Angola ,000 ,000 ,000 ,000 ,000

1174,694 Cabo Ver São Tomé Angola ,000 ,000 ,000 ,000

1681,759 Cabo Ver São Tomé Angola Guiné Bi Moçambiq ,000 ,000

6422,576 Brasil Cabo Ver São Tomé Angola Guiné Bi Moçambiq ,000

11545,70 Portugal Brasil Cabo Ver São Tomé Angola Guiné Bi Moçambiq

Figura 7 - método da média do grupo (unweighted pair-group average)

2.3.2.4 - Método da média simples (Weighted pair-group average)

A distância de um elemento i ao conjunto formado por dois grupos a e b, é a média simples das distâncias entre i e o grupo a e o grupo b.

Amalgamation Schedule

Weighted pair-group average

Euclidean distances

Passo Passo Passo Passo Passo Passo Passo

1 2 3 4 5 6 7

211,8709 Guiné Bi Moçambiq ,000 ,000 ,000 ,000 ,000

314,8911 São Tomé Angola ,000 ,000 ,000 ,000 ,000

1174,694 Cabo Ver São Tomé Angola ,000 ,000 ,000 ,000

1873,354 Cabo Ver São Tomé Angola Guiné Bi Moçambiq ,000 ,000

6494,823 Brasil Cabo Ver São Tomé Angola Guiné Bi Moçambiq ,000

9730,299 Portugal Brasil Cabo Ver São Tomé Angola Guiné Bi Moçambiq

Figura 8 - método da média simples (weighted pair-group average)

Embora ajude a preservar a individualidade dos pequenos grupos, a sequência de uniões deste tipo leva muitas vezes a grandes enviezamentos em benefício das últimas agregações efectuadas, desvalorizando grandes concentrações que se efectuaram em estádios iniciais do processo ascendente de agregação.

2.3.2.5 - Método do grupo centróide (Unweighted pair-group centroid)

A distância entre duas classes a e b, é a distância entre os centróides de a e de b. Os centróides são o centro de gravidade das classes, determinados pelas médias de cada variável.

A localização do centróide da nova classe resulta da média dos dois centróides ponderada pelo número de unidades de análise existentes em cada classe. É também um método de agrupamento muito utilizado.

Pode-se ver que, à medida que os grupos se tornam maiores, as distâncias entre os seus centroides aumenta e a fusão ocorre a níveis cada vez mais elevados.

Amalgamation Schedule

Unweighted pair-group centroid

Euclidean distances

Passo Passo Passo Passo Passo Passo Passo

1 2 3 4 5 6 7

211,8709 Guiné Bi Moçambiq ,000 ,000 ,000 ,000 ,000

314,8911 São Tomé Angola ,000 ,000 ,000 ,000 ,000

1095,971 Cabo Ver São Tomé Angola ,000 ,000 ,000 ,000

1332,760 Cabo Ver São Tomé Angola Guiné Bi Moçambiq ,000 ,000

5903,907 Brasil Cabo Ver São Tomé Angola Guiné Bi Moçambiq ,000

10293,49 Portugal Brasil Cabo Ver São Tomé Angola Guiné Bi Moçambiq

Figura 9 - método do grupo centroide (unweighted pair-group centroid)

2.3.2.6 - Método da mediana {Weighted pair-group centroid (median)}

A distância entre duas classes a e b, é a distância entre os centróides de a e de b, mas, no cálculo do centróide do novo grupo não se toma em consideração o número de elementos que existe em cada um, sendo as suas coordenadas a média simples das coordenadas dos centros dos dois grupos que se uniram.

Apresenta uma certa tendência para formar cadeias, embora menos forte do que o método do vizinho mais próximo.

Amalgamation Schedule

Weighted pair-group centroid (median)

Euclidean distances

Passo Passo Passo Passo Passo Passo Passo

1 2 3 4 5 6 7

211,8709 Guiné Bi Moçambiq ,000 ,000 ,000 ,000 ,000

314,8911 São Tomé Angola ,000 ,000 ,000 ,000 ,000

1095,971 Cabo Ver São Tomé Angola ,000 ,000 ,000 ,000

1507,032 Cabo Ver São Tomé Angola Guiné Bi Moçambiq ,000 ,000

5934,904 Brasil Cabo Ver São Tomé Angola Guiné Bi Moçambiq ,000

7966,613 Portugal Brasil Cabo Ver São Tomé Angola Guiné Bi Moçambiq

Figura 10 - método da mediana {weighted pair-group centroid (median)}

2.3.2.7 - Método de Ward ou da mínima variância

Baseia-se no pressuposto de que as classes devem ter a máxima homogeneidade interna possível. Ward propôs uma técnica de minimização da soma dos quadrados das distâncias de cada ponto ao respectivo centro de classe. Em cada nível, o novo grupo constitui-se pela combinação dos dois grupos cuja junção provoca o menor aumento da soma dos quadrados destas distâncias.

Desde que os indivíduos sejam pontos num espaço euclidiano, vimos que se definisse a qualidade de uma partição pela sua inércia intra-classe ou a sua inércia inter-classe. Uma boa partição é aquela pela qual a inércia inter-classe é forte (inércia intra-classe fraca). Desde que se passe duma partição em k+1 classes a uma partição em k classes agrupando duas classes numa só, veremos que a inércia inter-classe vai diminuir.

O critério de agrupamento será o seguinte: fundir as duas classes pelas quais a perda de inércia é a mais fraca. Tal leva a reunir as duas classes mais próximas tomando como distância entre duas classes a perda de inércia que as encurta aquando do agrupamento.

Amalgamation Schedule

Ward`s method

Euclidean distances

Passo Passo Passo Passo Passo Passo Passo

1 2 3 4 5 6 7

211,8709 Guiné Bi Moçambiq ,000 ,000 ,000 ,000 ,000

314,8911 São Tomé Angola ,000 ,000 ,000 ,000 ,000

1461,295 Cabo Ver São Tomé Angola ,000 ,000 ,000 ,000

3198,624 Cabo Ver São Tomé Angola Guiné Bi Moçambiq ,000 ,000

6923,011 Portugal Brasil ,000 ,000 ,000 ,000 ,000

20562,82 Portugal Brasil Cabo Ver São Tomé Angola Guiné Bi Moçambiq

Fifura 11 - método de Ward ou da mínima variância

A análise dos quadros e figuras põe em evidência a existência de duas classes relativamente homogéneas: Moçambique e Guiné, por um lado e, a curta distância, Angola e São Tomé, por outro.

Cabo Verde aparece numa situação intermédia entre estes dois grupos e o Brasil.

Portugal aparece sempre destacadamente a um nível muito superior.

Assim, no que respeita ao grau de desenvolvimento, propomos os seguintes agrupamentos:

    • Países com grau de desenvolvimento baixo

I - Moçambique + Guiné

II - Angola + São Tomé

III - Cabo Verde

    • País com grau de desenvolvimento médio

IV - Brasil

    • País com grau de desenvolvimento elevado

V - Portugal

2.3.3 - Classificação após redução das variáveis originais em componentes através da análise de componentes principais

De uma maneira geral, é recomendada confirmação dos resultados duma classificação pelo exame dos planos factoriais duma análise de componentes principais ou de uma análise das correspondências: os dois processos são complementares, a análise factorial permite, ainda, interpretar rapidamente em função das variáveis os agupamentos obtidos por uma classificação, como foi feito no Capítulo I.

Procedemos a vários tipos de classificação sobre o mesmo conjunto utilizando diversas fórmulas, de forma a conferir os resultados finais e tomarmos as decisões da forma mais informada possível.

Quando é utilizado um largo número de variáveis existem problemas maiores. Uma solução é o uso da análise de componentes principais de forma a reduzir o número de variáveis sem as excluir (Quadro XVII).

A substituição das variáveis pelos componentes significa que os indivíduos são enumerados pelos scores dos componentes e não directamente medidos por quantidades.

Quadro xvii - matriz de atributos (após análise de componentes principais)

COMPONENTE_1 COMPONENTE _2 COMPONENTE _3

Portugal 0,410 2,116 -0,056

Brasil 1,135 -0,035 0,702

C.Verde 0,366 -0,603 0,722

S.Tomé 1,140 -0,988 -1,104

Angola -1,047 -0,057 -1,310

Guiné -0,941 -0,009 -0,344

Moçamb -1,063 -0,424 1,389

Quadro xviii - matriz de distâncias euclideanas (inicial) após a redução de variáveis

Portugal Brasil C.Verde S.Tomé Angola Guiné Moçamb

Portugal 0,00 2,39 2,83 3,36 2,90 2,53 3,27

Brasil 2,39 0,00 0,96 2,04 2,97 2,33 2,33

C.Verde 2,83 0,96 0,00 2,02 2,53 1,79 1,59

S.Tomé 3,36 2,04 2,02 0,00 2,39 2,42 3,37

Angola 2,90 2,97 2,53 2,39 0,00 0,97 2,72

Guiné 2,53 2,33 1,79 2,42 0,97 0,00 1,79

Moçamb 3,27 2,33 1,59 3,37 2,72 1,79 0,00

Utilizando esta técnica, os resultados são ligeiramente diferentes, no entanto, Portugal aparece sempre nitidamente diferenciado dos outros países.

O Brasil surge sempre associado a Cabo Verde, e a Guiné tem semelhanças nítidas com Angola.

Ao contrário da técnica anterior, recorrendo à redução das variáveis originais em componentes principais, a distância a que se dá a junção dos países ou dos grupos de países é muito menor.

 

Amalgamation Schedule န Single Linkage

Euclidean distances

Passo 1 Passo 2 Passo 3 Passo 4 Passo 5 Passo 6 Passo 7

0,956494 Brasil C.Verde ,000 ,000 ,000 ,000 ,000

0,972869 Angola Guiné ,000 ,000 ,000 ,000 ,000

1,586538 Brasil C.Verde Moçambiq ,000 ,000 ,000 ,000

1,786473 Brasil C.Verde Moçambiq Angola Guiné ,000 ,000

2,019682 Brasil C.Verde Moçambiq Angola Guiné S.Tomé ,000

2,393213 Portugal Brasil C.Verde Moçambiq Angola Guiné S.Tomé

Figura 12 - classificação após redução das variáveis originais em componentes através da ACP

Referências Bibliográficas

Beguin, H. - "Analyse quantitative", in Bailly, Antoine (Coord.) (1991) - Les Concepts de la Geographie Humaine, Paris, Masson, pp. 195-203.

Blalock, H. (1979) - Social Statistics, McGraw Hill, Tóquio.

Box, G. e Jenkins, G. (1976) - Time Series Analysis: forecasting and control, Holden-Day, San Francisco.

Bryman, A. e Cramer, D. (1993) - Análise de dados em Ciências Sociais: introdução às técnicas utilizando o SPSS. Celta, Oeiras.

Canto, C. et al (1988) - Trabajos Prácticos de Geografía Humana. Editorial Sintesis, Madrid. Pp. 22-29, 52-57, 140-147.

Chatfield, C. (1984) - The Analysis of Time Series. 3rd Ed., Chapman & Hall, London, UK.

Ciceri, M. F. et al (1977) - Introduction à l’analyse de l’espace. Masson, Paris.

Clark, W. e Hosking, P. (1986) - Statistical methods for geographers. John Wiley, New York.

Commissariat a l’énergie atomique (1978) - Statistique Appliqué a l’Exploitation des Mesures. Tome 1. Masson, Paris. ISBN 2-225-49225-5

Commissariat a l’énergie atomique (1978) - Statistique Appliqué a l’Exploitation des Mesures. Tome 2. Masson, Paris. ISBN 2-225-49236-0

D’hainaut, L. (1992) - Conceitos e métodos da estatística, vol. II န duas ou três variáveis segundo duas ou três dimensões. Fundação Calouste Gulbenkian, Lisboa.

Ebdon, D. (1996) - Statistics in Geography. Blackwell, Oxford (UK).

Elzey, F.F. (1974) - A First Reader in Statistics. Brooks/Cole Publishing Company, Pacific Grove, California, USA.

Estebanez, J. e Bradshaw, R. (1979) - Técnicas de Quantificacion en Geografía. Editorial Tebar Flores, Madrid.

Freund, J.E. & Simon, G.A. (1995) - Statistics. Prentice Hall, Englewood Cliffs, New Jersey.

Gerardi, Lucia; Silva, Barbara-Chistine (1981) - Quantificação em Geografia, Difel, São-Paulo, pp. 11-29.

Groupe Chadule (1987) - Initiation aux Pratiques Statistiques en Géographie. Masson, Paris.

Guillemot, H. (1995) - "O que escondem as sondagens?", Notícias Magazine, 26-02-1995. Pp. 17-23.

Hair, J.F. et al (1995) - Multivariate Data Analysis. 4th Ed., Prentice Hall, New Jersey, USA.

Healey, J.F. (1996) - Statistics: a Tool for Social Research. 4th Ed., Wadsworth Publishing Company, Belmont, California, USA. ISBN 0-534-25152-8

Kendall, M. (1976) - Time-Series. Charles Griffin & Company Ltd., London.

Lindsay, J. (1997) - Techniques in Human Geography, Routledge, London.

Moroney, M.J. (1969) - Dos Números aos Factos. Edições Despertar, Porto.

Morrison, d.f. (1990) - Multivariate Statistical Methods. 3rd Ed., McGraw-Hill International Editions, Singapore. ISBN 0-07-100815-2

Murteira, B.J.F. (1979) - Probabilidades e Estatística. vol I, Ed. McGraw-Hill de Portugal, Lda., Lisboa.

Murteira, B.J.F. (1990) - Probabilidades e Estatística. vol II, Ed. McGraw-Hill de Portugal, Lda., Lisboa.

Parikh, A. e Bailey, D. (1990) - Techniques of Economic Analysis with Applications. Harvester Wheathsheaft, New York, p. 1-166.

Pestana, M.E. e Gageiro, J.N. (1998) - Análise de dados para Ciências Sociais. A complementaridade do SPSS. Edições Sílabo, Lisboa.

PNUD (1998) - Relatório do Desenvolvimento Humano 1998, Trinova Editora, Lisboa.

Reis, E. (1997) - Estatística Aplicada. vol. I, Edições Sílabo, Lisboa.

Reis, E. (1997) - Estatística Aplicada. vol. II, Edições Sílabo, Lisboa.

reis, e. (1997) - Estatística Multivariada Aplicada. Edições Sílabo, Lisboa.

Santos Preciado, J.M. e Muguruza Cañas, C. (1984) - "Microordenadores y Análisis Estadística en Geografía", in Bosque Sendra, J. et al (eds.) - Aplicaciones de la Informática a la Geografía y Ciências Sociales. Editorial Sintesis, Madrid.

Schleifer, A. & Bell, D.E. (1994) - Data Analysis, Regression and Forecasting. Course Technology, Cambridge, USA.

Spiegel, M.R. (1994) - Estatística. 3 Ed., Makron Books e McGraw-Will, São Paulo.

Tacq, j. (1997) - Multivariate Analysis Techniques in Social Science Research. Sage Publications, London. ISBN 0-7619-5272-1

The Economist (1993) - Guia dos números. Caminho, Lisboa, pp. 95-111.

Vialar, J. (1977) - Calcul des Probabilités et Statistique န tome I: éléments de calcul des probabilités. Secrétariat d’État auprès du Ministre de l’Équipement, France.

Vialar, J. (1977) - Calcul des Probabilités et Statistique န tome II: Statistique: étude des échantillons. Secrétariat d’État auprès du Ministre de l’Équipement, France.

Vialar, J. (1977) - Calcul des Probabilités et Statistique န tome III: Statistique: contingence et corrélation. Secrétariat d’État auprès du Ministre de l’Équipement, France.

Vialar, J. (1978) - Calcul des Probabilités et Statistique န tome IV: Statistique: étude des séries cronologiques. Secrétariat d’État auprès du Ministre de l’Équipement, France.

Volle, M. (1978) - Analyse des Données. Economica, Paris.

Yeomans, K.A. (1977) - Statistics for the Social Scientist: 1 - Introducing Statistics. Penguin Books, Harmondsworth.

Yeomans, K.A. (1977) - Statistics for the Social Scientist: 2 - Applied Statistics. Penguin Books, Harmondsworth.

(vários) (1984) - Spatial Statistics and Models. D. Reidel Publishing Company, USA.

Internet:

<http://www.un.org.mx/pnud>

<http://www.undp.org/>

<http://www.undp.org/hdro/report.html>

<http://www.undp.org/eo/fe96c1.html>

<http://www.undp.org.br/HDR/HDR99.html>

<http://www.undp.org/hdro/index2.html>

<http://www.undp.org/hdro/kit.html>

<http://www.undp.org/hdro/authors.html>

<http://www.undp.org/hdro/contents.html>

<http://www.undp.org/hdro/front.pdf>

<http://www.undp.org/hdro/overview.pdf>

<http://www.undp.org/hdro/10year.html>

<http://www.undp.org/hdro/front.pdf>)

<http://www.undp.org/hdro/Chapter1.pdf>

<http://www.undp.org/hdro/Chapter2.pdf>

<http://www.undp.org/hdro/Chapter3.pdf>

<http://www.undp.org/hdro/Chapter4.pdf>

<http://www.undp.org/hdro/Chapter5.pdf>

<http://www.undp.org/hdro/Backmatter1.pdf>

<http://www.undp.org/hdro/HDI.html>

<http://www.undp.org/hdro/Backmatter2.pdf>

<http://www.undp.org/hdro/hdrolife.html>

<http://www.undp.org/hdro/reviews.html>

<http://www.undp.org/hdro/ordering.html>

<http://stone.undp.org/undpweb/hdr/>

<http://www.undp.org/hdr2000/french/HDR2000.html>

Programas informáticos de Tratamento de Dados:

  • DIOGO & ROQUETTE SOFTWARE
  • SPSS
  • StatSoft, Inc. (1995). STATISTICA for Windows [Computer program manual]. Tulsa.

 

 

Dados do Autor:

José Alberto Afonso Alexandre

jaaalexandre[arroba]gmail.com

jaaalexandre[arroba]hotmail.com

Mestre em Inovação e Políticas de Desenvolvimento (Universidade de Aveiro)

Licenciado em Geografia (Universidade de Coimbra)

Publicação em «monografias.com» de:

«O planeamento estratégico como instrumento de desenvolvimento de cidades de média dimensão», (https://www.monografias.com/pt/trabalhos/planeamento-cidades/planeamento-cidades.shtml);

«Rumo à sustentabilidade: o planeamento urbano participativo», (https://www.monografias.com/pt/trabalhos2/sustentabilidade-urbana/sustentabilidade-urbana.shtml);

O turismo em Portugal: evolução e distribuição, (https://www.monografias.com/pt/trabalhos2/turismo-portugal/turismo-portugal.shtml).

Partes: 1, 2, 3
>

 Página anterior Voltar ao início do trabalhoPágina seguinte 



As opiniões expressas em todos os documentos publicados aqui neste site são de responsabilidade exclusiva dos autores e não de Monografias.com. O objetivo de Monografias.com é disponibilizar o conhecimento para toda a sua comunidade. É de responsabilidade de cada leitor o eventual uso que venha a fazer desta informação. Em qualquer caso é obrigatória a citação bibliográfica completa, incluindo o autor e o site Monografias.com.