Analisi statistica della Divina Commedia – parte 14

di Stefano Sampietro
 
L’analisi dei types per lettera iniziale
 
Dante1Negli ultimi due appuntamenti della rubrica Formule e Parole, avevamo comparato la ricchezza lessicale della Divina Commedia e di Dante Alighieri con quella di altre opere e autori famosi (parte 12 e parte 13). Oggi, come anticipato, torneremo sui binari di un’analisi più strettamente statistica, studiando la Divina Commedia rispetto alla lettera iniziale, e successivamente a quella finale, delle parole che la compongono.
Per il momento, volgeremo l’attenzione all’insieme delle parole (types), mentre considereremo i tokens a partire dal prossimo post (ricordo che un token è la frequenza con cui una parola si presenta; ad esempio, siccome nella Divina Commedia la parola “ciel” si ripete 106 volte, possiamo dire che il type “ciel” ha 106 tokens).
Cominciamo col notare che le parole che iniziano con la lettera S sono le più numerose e sono 1590. A seguire, ci sono le parole che iniziano per C (1348), poi quelle per A (1241). Tutti i types suddivisi per lettera iniziale sono:
iniziale
parole
parole (%)
cumulate
S
1590
12,39%
12,39%
C
1348
10,51%
22,90%
A
1241
9,67%
32,57%
P
1203
9,38%
41,95%
R
909
7,08%
49,03%
D
898
7,00%
56,03%
M
726
5,66%
61,69%
F
688
5,36%
67,05%
T
676
5,27%
72,32%
V
624
4,86%
77,18%
I
501
3,90%
81,08%
G
496
3,87%
84,95%
L
421
3,28%
88,23%
B
364
2,84%
91,07%
N
347
2,70%
93,77%
E
250
1,95%
95,72%
O
245
1,91%
97,63%
U
164
1,28%
98,91%
Q
88
0,69%
99,59%
X
25
0,19%
99,79%
Z
17
0,13%
99,92%
H
8
0,06%
99,98%
J
2
0,02%
100,00%
tot
12831
100%
 
tabella 1
Più di un quinto (22,90%) delle parole della Divina Commedia inizia con S o C; quasi la metà (49,03%) con S, C, A, P o R .
La distribuzione delle parole per lettera iniziale è tradotta graficamente nel seguente diagramma:
iniziale_types

grafico 1
 
Riclassificando le lettere iniziali per vocali e consonanti, scopriamo che nella Divina Commedia 2401 types iniziano per una vocale e 10430 per una consonante. In termini percentuali:
 
iniziale
parole
parole (%)
vocale
2401
18.71%
consonante
10430
81.29%
tabella 2
iniziale_types_torta

grafico 2
 
Introducendo le frequenze con cui le parole appaiono nella Divina Commedia, le distribuzioni per lettera iniziale cambiano… ma questo è l’argomento del prossimo post.
Saluti stocastici!

Vuoi discutere di questo articolo? Vuoi porre domande all’autore? Visita la sezione Formule e Parole del forum di XII.

 

Annunci
Questa voce è stata pubblicata in formule e parole. Contrassegna il permalink.

Rispondi

Effettua il login con uno di questi metodi per inviare il tuo commento:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...