Filters








1 Hit in 0.053 sec

Francesca Tomasi, Metodologie informatiche per le discipline umanistiche, prefazione di Dino Buzzetti. Roma. Carocci editore. Manuali universitari (Linguistica)/59. 2008. pp. 256. ISBN 978-88-430-4303-3

Alessandro Iannucci
2012
Francesca Tomasi, Metodologie informatiche per le discipline umanistiche. Prefazione di Dino Buzzetti. Roma. Carocci editore. Manuali universitari (Linguistica)/59. 2008. pp. 256. ISBN 978-88-430-4303-3 L'incontro tra humanities e computer science, oggi al centro dell'attenzione dei cultori di entrambi i saperi, è in realtà molto più antico di quanto generalmente si supponga. Già negli anni Quaranta dello scorso secolo lo studioso di filosofia medievale Padre Roberto Busa si poneva il problema
more » ... poneva il problema dell'analisi automatica dei testi, come egli stesso ha raccontato nell'introdurre un recente Companion to Digital humanities: «During World War II, between 1941 and 1946, I began to look for machines for the automation of the linguistic analysis of written texts. I found them, in 1949, at IBM in New York City. Today, as an aged patriarch (born in 1913) I am full of amazement at the developments since then; they are enormously greater and better than I could then imagine» 1 . Analogo stupore di fronte al contemporaneo sviluppo delle macchine da calcolo avrebbe forse colpito un coetaneo di Busa, Alan Turing (1912-1950 che in quegli stessi anni di guerra, cooptato dal Government Code and Cypher School (GCCS) britannico nella sede di Bletchley Park, progettava strumenti automatici per la decrittazione delle informazioni in codice utilizzate dal nemico tedesco 2 . Turing aveva già elaborato nel 1936 un modello matematico formale -la cosiddetta 'macchina di Turing' -che rappresenta ancora una base imprescindibile per il successivo sviluppo dei computer 3 . Decrittare codici, analizzare testi attraverso strategie computazionali e automatiche con l'ausilio di macchine: la visualizzazione storica dei processi culturali spesso rivela parallelismi suggestivi e induce a riconsiderare prospettive. Già all'epoca inaugurata da Busa, infatti, le humanities iniziano a muovere i primi passi verso l'automazione alla ricerca non solo di uno strumento, un aristotelico organon, efficace ausilio a prassi e procedimenti consolidati, ma piuttosto di un nuovo methodos -nell'accezione greca di pursuit of knowledge, scientific inquiry 4 -con cui rielaborare lo stesso assetto disciplinare e le sue possibilità euristiche. La contaminazione con altri settori ha sempre giovato all'innovazione e allo sviluppo della computer science e ha favorito lo sviluppo di saperi nuovi e autonomi, basti pensare alla 1 BUSA (2004); il companion cui si fa riferimento è quello curato da SCHREIBMAN -SIEMENS -UNSWORTH (2004). Il progetto di Busa si è realizzato in una prima versione a stampa di indici e concordanze degli opera omnia di Tommaso d'Aquino (BUSA [1974] ) ora accessibili anche online: http://www.corpusthomisticum.org/. 2 Cf. COPELAND (2004; 2006) ; sul periodo di Turing a Bletchley Park si veda ora il progetto del Knowledge Media Institute (Open Unversity, London): http://kmi.open.ac.uk/projects/bp-text/; al riguardo cf. COLLINS -MULHOLLAND -ZDRAHAL (2005). 3 Cf. HODGES (1991) e NUMERICO (2005); per una più ampia 'storia' dell'invenzione del calcolatore si può far riferiemnto a CERUTTI (2005). 4 Cf. LSJ 9 , s.v. Annali Online di Ferrara -Lettere Vol. 1 (2008) 168/178 bioinformatica. Un analogo processo sembra essersi delineato anche in rapporto alle humanities, in particolare con lo sviluppo della linguistica computazionale che porta alla nascita, già nel 1973, di una "Association for Literary and Linguistic Computing" 5 . L'esistenza di un spazio teoretico autonomo, in grado di contribuire allo sviluppo di metodi computazionali, appunto la humanities computer science, è stato ben chiarito dal Working Group on Formal Methods in Humanities (Bergen, 1999) e distinto da altre prospettive riassunte nelle due categorie della Humanities Computer Literacy (utilizzo di strumenti informatici in ambito umanistico) o alla Humanities computing (applicazione di metodi) 6 . Questo, in breve, lo scenario della Informatica umanistica, per venire infine a una condivisa definizione in lingua italiana 7 . Un campo disciplinare autonomo, quindi, in cui i due domini di partenza non sono ausiliari l'uno rispetto all'altro ma piuttosto compenetrati tra loro e in grado di produrre nuovi modelli conoscitivi; da qui la necessità di assicurare una tradizione didattica, anche attraverso la produzione di handbook, segno di autorevolezza e continuità per ogni sapere 'nuovo'. Il recente volume di Francesca Tomasi (= T.) coglie pienamente tale scenario e ne sintetizza fin dal titolo lo svolgimento 8 . La coppia metodologie informatiche e discipline umanistiche intende appunto focalizzare questo obiettivo: «Non si vuole un'informatica per le discipline umanistiche, ma si vogliono coniugare informatica e discipline umanistiche. L'informatica non deve essere strumento a uso dell'umanista, ma deve essere pensata come fondamento per una riflessione sui metodi della ricerca umanistica» (p. 21). Ambizione del tutto lecita, e coerentemente perseguita nella stessa strutturazione del volume. Infatti, come osserva Dino Buzzetti nella sua densa Prefazione (pp. 11-4), implicitamente la T. prende posizione «in un dibattito tuttora aperto, che oppone coloro che considerano l'informatica umanistica come una disciplina autonoma e scientificamente fondata a quanti privilegiano l'ottica delle discipline tradizionali, alle quali lo sviluppo dell'informatica offre nuovi e spesso essenziali strumenti di ricerca» (p. 11); autonomia disciplinare che si fonda sull'«esplicitazione del metodo» (p. 12), in particolare quando i temi della rappresentazione digitale dell'informazione e della elaborazione automatica dei dati sono declinati nei due ambiti forse maggiormente caratterizzanti: il web semantico e la linguistica computazionale (cf. p. 14) 9 . A. Iannucci interpretazione dei testi imposta dalla riproduzione digitale (pp. 124-38). La stessa nozione di testo e i tradizionali metodi di interpretazione ne risultano in qualche modo rimessi in gioco: «il markup è un processo che costringe alla riflessione sul concetto di testo e sulle diverse forme della sua rappresentazione elettronica e quindi interpretazione» (p. 139). Nel cap. 5 la nozione di testo digitale è ulteriormente sviluppata in quella di progettazione di ipertesti con le relative strategie di modellizzazione e di comunicazione, efficacimente esemplificate attraverso gli ipertesti letterari e la rappresentazione ipertestuale di un'edizione critica. Nel cap. 6, infine, è affrontato il tema della conversione di dati analogici in digitali con particolare riferimento alle tecniche e agli standard necessari per i processi di digitalizzazione di immagini, in riferimento sia a immagini del patrimonio culturale, sia a immagini di testi e al conseguente problema del riconoscimento dei caratteri o OCR (Optical Character Recognition). Nella terza parte (Il trattamento dell'informazione, il volume introduce i due temi core dell'informatica umanistica in cui l'incontro e la contaminazione di saperi e competenze diverse consente un effettivo incremento di conoscenze in entrambi i domini: la linguistica computazionale e il semantic web in relazione allo sviluppo delle digital libraries e al nuovo 'paradigma digitale'. Il cap. 7 I sistemi di analisi del testo e la linguistica computazionale (pp. 191-211) è dedicato all'approccio computazionale ai testi e ai fenomeni linguistici che, come si è detto, ha in qualche modo dato origine alle digital humanities 10 . Attraverso il text retrieval -il recupero automatico di stringhe di caratterie la text analysis -«recupero ed estrazione non solo di dati, intesi come stringhe di caratteri, ma di informazione, intesa come dato interpretato» (p. 192) -i tradizionali strumenti del dominio filologico quali la costruzione di indici, concordanze, frequenze e le analisi stilometriche si riattualizzano nel contesto digitale. La biblioteca del filologo è tuttora composta di imponenti volumi, spesso opera totius vitae di studiosi, attraverso i quali è possibile sondare stratificazioni, emendare passi corrotti, verificare la fortuna e la ricezione di un autore o di un genere, ipotizzare datazioni relative tra le opere di uno stesso autore sulla base di analisi linguistiche e stilometriche. Come intuito da Busa, il trattamento digitale dell'informazione consente di ottimizzare e accrescere esponenzialmente funzione ed efficacia di tali strumenti, fino a implementare sofisticati sistemi di analisi lessicale, morfo-sintattica e semantica con l'obiettivo finale di «acquisire nuova conoscenza dai testi che sia utilizzabile dalla macchina in modo automatico» (p. 230). Quest'ultimo tema si collega con l'oggetto specifico del successivo cap. 8 (Semantic Web: modelli, architettura e linguaggi, pp. 213-34), la frontiera forse di maggior interesse non solo per l'informatica umanistica, ma più in generale per la computer science e in particolare per il settore dell'Artificial Intelligence (AI). In breve la sfida consiste nel rendere possibile una sorta di 'comprensione' o di 'conoscenza' da parte delle macchine dei testi raccolti nel Web in vista di una crescita del sapere realizzata attraverso connessioni o relazioni prodotte in modo automatico. Per raggiungere questo obiettivo è 10 Sulla linguistica computazionale cf. CHIARI (2007), opportunamente segnalato nel volume di T. (p. 210). A. Iannucci memorizzazione e/o il reperimento delle informazioni. L'utilizzo di questi elementi per certi versi metatestuali risponde evidentemente al carattere specifico della collana che ospita il volume (Manuali universitari); ma l'impressione è che T. sfrutti tale griglia redazionale per rendere maggiormente ipertestuale la trattazione della materia. In questo senso vanno segnalati i frequenti rimandi interni, non solo nel corpo del testo ma spesso anche nelle annotazioni, nei paragrafi introduttivi e nei sommari conclusivi, negli approfondimenti bibliografici; tale reticolo suggerisce percorsi alternativi e guida attraverso un efficace sistema di linking tra le diverse parti del volume conferendogli un valore aggiunto di reference book 11 . I termini tecnici sono conservati in inglese, tipograficamente evidenziato con il corsivo, ma tuttavia forniti di opportuni chiarimenti, quasi glosse esegetiche che non appesantiscono tuttavia il testo ma contribuiscono a recuperare il senso di espressioni ormai triviali anche in italiano ma di cui si è talora persa consapevolezza (per es. a p. 29, bit, è non solo sciolto in Binary digIT ma spiegato come la «cifra binaria» e «unità di misura necessaria per calcolare quanti 0 e/o 1 compongono un oggetto digitale»). L'uso della prima persona plurale, in questa stessa prospettiva, non è mai percepibile come inopportuno pluralis maiestatis ma rivela piuttosto il tono colloquiale adottato (anche se ciò richiederebbe una maggiore coerenza: per es. tra p. 72 e p. 73 stride lo iato tra costruzione personale e impersonale) che rende a un tempo scorrevole e 'guidata' la lettura (cf. p. 66: «Di essi parleremo nel dettaglio nel cap. 6»; p. 67: «Un concetto che vogliamo per ora solo introdurre è quello di metadati [...] perché costituiranno un motivo ricorrente in tutto il volume»; etc.) Da segnalare, infine, la particolare attenzione rivolta alla dimensione storica dei problemi affrontati (oltre alla nota su Le origini a pp. 17s., risulta particolarmente efficace e documentato il paragrafo dedicato a La nascita del concetto di ipertesto prima della sua realizzazione pratica a pp. 145-8, con interessanti osservazioni sulle ricerche di Vannevar Bush e Ted Nelson, fino a Douglas Engelbart e la nascita del Web in seguito al progetto di Tim Berners-Lee per la condivisione dei documenti e delle informazioni di ricercatori del CERN). In conclusione si dispone oggi di un aggiornato e puntuale manuale che rappresenta sicuramente una base solida per l'insegnamento e potrà contribuire a rilanciare, anche in Italia, il dibattito su una disciplina che in ambito accademico non ha ancora trovato una sua opportuna definizione e collocazione, malgrado la progressiva espansione di insegnamenti e corsi di informatica umanistica 12 . In un recente intervento, Pietro Citati ha ricordato «i computer applicati all'analisi letteraria» come uno dei mali che affliggerebbero l'università italiana sull'imitazione di modelli americani, tra cui «la cattedra di gelato artigianale, di cappellini per signore, di jeans per ragazzi e ragazzi, di 11 Un indice complessivo delle figure e degli esempi, insieme a un indice analitico, avrebbero rappresentato un ulteriore, utile strumento di fruizione trasversale del volume. 12 Cf. FERRARINI (2006); un'utile sitografia sulla didattica dell'informatica umanistica in Italia è in Griseldaonline A. Iannucci sandali per i tropici» e altre varie amenità 13 . Si potrebbe ricordare a Citati un suo analogo intervento di oltre quarant'anni fa in cui -nel recensire Apocalittici e integrati di Umberto Eco -paventava un futuro in cui «su tutte le cattedre universitarie giovani docenti analizzeranno i fenomeni della cultura di massa» e l'arguta risposta avuta dallo stesso recensito sul valore «mirabilmente profetico» di quelle parole 14 . L'auspicio è quindi che Citati sia ancora una volta profetico e che l'Informatica umanistica trovi presto quel riconoscimento istituzionale che ancora le manca. Homines dum docent discunt è un noto adagio di Seneca (Ad Lucilium I 7, 8) che può certo essere riproposto nell'attuale riposizionamento dei due assi portanti -e talora dialettici -della vita universitaria: didattica e ricerca. Il volume di Francesca Tomasi, proprio in ragione della complessiva ricognizione della materia a fini didattici, rappresenta anche un importante contributo a un'efficace definizione dello statuto di una nuova e autonoma disciplina.
doi:10.15160/1826-803x/149 fatcat:apies4mujre23mnpeysplwwzke