I Nobel per la letteratura – parte 5: una previsione “out-of-sample”

di Stefano Sampietro
 

nobelIl profilo del premio Nobel ideale che emerge dall’analisi fin qui condotta è dunque quello di uno scrittore maschio, europeo e d’età avanzata. Lo sbocco naturale di questo lavoro è quello di fornire una previsione circa il prossimo Nobel, ma, prima di farlo, propongo un esperimento finalizzato a testare la capacità predittiva dell’analisi.
In statistica, esiste una tecnica, detta “previsione out-of-sample”, che assolve a questo scopo. Si basa sull’idea di scartare la parte più recente del campione analizzato e far finta che non esista; poi, utilizzando solo il campione rimasto, si fanno previsioni circa la parte scartata; infine si recupera il campione scartato e lo si confronta le quantità previste: più simili sono tra loro, migliore è la capacità del modello di prevedere.
Volendo applicare questa tecnica all’analisi dei premi Nobel fino a qui condotta, potremmo pensare di scartare l’ultimo Nobel assegnato, quello del 2008, e verificare quale sarebbe stata la nostra previsione. Sarebbe come tornare indietro nel tempo, diciamo a inizio 2008, e cercare di prevedere il Nobel di quell’anno.

Ripetendo l’analisi ignorando il dato relativo al premio del 2008, i risultati non cambiano molto e si possono riassumere come segue:

 
1)      Previsione sesso: maschio (la frequenza dei maschi è del 91.35%, cioè 95/104).
 
2)      Previsione età: 68.66 anni (La formula della retta interpolante calcolata tra i punti del grafico con le età dei vincitori – come fatto nella parte 2 -, è adesso pari a
 
“età”= 0.0819 x “anno” – 95.799
 
inserendo l’anno 2008, si ottiene “età” = 0.0819 x 2008 – 95.799 = 68.66).
 
3)      Previsione provenienza: Francia (La Francia è lo Stato con frequenza più alta: 11.54% = 12/104).
 
4)      Previsione lingua: Inglese(L’inglese è la lingua più frequente: 24.04% = 25/104).
 
Naturalmente i profili 3 e 4 sono in conflitto, quindi immagino che questa ipotetica previsione sarebbe stata doppia e avrei concluso che il prossimo Nobel sarebbe probabilmente stato:
 
A)     Maschio, età compresa tra i 68 e i 69 anni, nato in Francia.
 
Oppure
 
B)      Maschio, età compresa tra i 68 e i 69 anni, di lingua inglese.
 
Ebbene, si dà il caso che il Nobel 2008 sia Jean-Marie Gustave Le Clézio, cioè una persona con queste caratteristiche:
 
1)      Sesso: maschio
2)      Età: 68.49 anni (È nato il 13 aprile 1940)
3)      Provenienza: Francia
 leclezio
La previsione A sarebbe stata vincente al 100% e la B avrebbe azzeccato due profili su tre. Direi che il bilancio è estremamente positivo. In particolare mi sembra notevole la predizione sull’età, quasi perfetta.
Mi pento di non aver scritto questa rubrica prima dell’ottobre 2008. Avrei certamente ottenuto fama e ricchezza. Tuttavia la legge di Murphy incombe anche, e forse sopratutto, sugli statistici e ho aspettatto troppo. Tra l’altro, la stessa legge farà sì che le previsioni per il Nobel 2009 saranno completamente sballate, ne sono tristemente certo. Ma a questo riguardo rimando alla prossima (e ultima) puntata… saluti stocastici!


Vuoi discutere di questo articolo? Vuoi porre domande all’autore? Visita la sezione Formule e Parole del forum di XII.

 
Annunci
Questa voce è stata pubblicata in formule e parole. Contrassegna il permalink.

Rispondi

Effettua il login con uno di questi metodi per inviare il tuo commento:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...