Il computer nell'analisi dei testi

Maurizio Lana

Il computer nell'analisi dei testi

Edizione a stampa

29,50

Pagine: 264

ISBN: 9788820488703

Edizione: 1a edizione 1994

Codice editore: 1406.2

Disponibilità: Nulla

L'analisi dei testi con il computer è un settore di ricerca interdisciplinare che collega campi di studio molto diversi tra loro: linguistica, letteratura, sociologia, storia, filosofia...

Ed è forse per questo motivo che manca tuttora di una fondazione sistematica e metodologica, oltre al fatto che non è facile reperire informazioni su programmi, centri di ricerca, repertori di testi, risorse in rete Internet, libri, periodici.

Nella prima parte del volume, di taglio metodologico, vengono affrontati problemi aperti quali: che cos'è una parola? come si può conservare l'ordine delle parole in un'analisi quantitativa? qual è l'utilità dello studio delle "parole vuote" è meglio analizzare un singolo testo o un corpus? come si possono rappresentare graficamente i dati testuali? come si opera e qual è la finalità della codifica dei testi e delle loro varianti? che cos'è e a cosa serve la lemmatizzazione? come si interpretano i dati di frequenza? si può "misurare" lo stile di un testo? Vengono inoltre presentati alcuni strumenti classici dell'analisi dei testi: indici e concordanze, analisi stilometriche, analisi delle corrispondenze, ricerche di coocorrenze e di segmenti ripetuti.

La seconda parte, di taglio operativo, presenta raccolte di testi su supporto magnetico, corpora testuali, repertori di programmi per analisi morfosintattiche o generico text retrival per Dos, Wiindows, Macintosh.

Uno spazio particolare è dedicato alle lingue classiche e ai loro testi: ai programmi per la lemmatizzazione del greco e del latino, alle raccolte di testi su Cd-Rom e ai programmi per gestirne l'interrogazione, al progetto Perseus per lo studio della civiltà greca del V secolo a.C., al problema della scrittura con caratteri greci.

Un'apposita appendice è dedicata alla rete Internet: sono presentati i fornitori, nel settore pubblico e privato, di accesso alla rete; sono descritti i servizi di base e le modalità per attivarli; sono riportate le trascrizioni di sessioni di lavoro con alcune delle risorse così raggiungibili: cataloghi librari di dedite di milioni di titoli disponibili 24 ore su 24 per ricerche bibliografiche, banche dati testuali su cui reperire Aristotele accanto alla Primula Rossa, computer remoti dai quali si prendono font di alfabeto fonetico internazionale, un elenco completo dei gruppi di discussione interessanti per gli studiosi di testi in area umanistica.

Dati precisi permettono di reperire il produttore o il distributore di ogni prodotto citato (programmi, banche dati, libri, riviste). Rimandi interni collegano la parte metodologica e quella operativa, rendendo il volume una vera e propria opera di riferimento.

Guida alla lettura

PRIMA PARTE - PROBLEMI E METODI NELL'ANALISI DEL TESTI

Cenni sulla storia dell'analisi del testi assistita da computer
* Che cosa è l'analisi dei testi
* Inizi e orientamenti attuali dell'analisi dei testi assistita da computer

Nuovi strumenti per attività consuete
* Text retrieval: ricerca di passi, produzione di indici e concordanze

Nuovi strumenti per nuove attività
* Perseus
* Il Textual Criticism Challenge Collate
* Pubblicazione di testi su supporto magnetico
* Riviste elettroniche
* Xanadu

Problemi aperti
* I metodi dell'analisi di testi assista da computer e la prudenza del ricercatore
* Il trattamento dei testi da parte del computer non è quello dei filologi
* Difficoltà di identificare che cosa sia una parola
* Nell'analisi quantitativa si perde l'ordine delle parole
* Possibile utilità dello studio delle «parole vuote»
* L'oggetto dell'analisi
* Un singolo testo o un corpus?
* Tutti i dati testuali o un campione?
* Lo scopo dell'analisi: descrizione dei dati o verifica di ipotesi?
* Rappresentazione grafica dei dati testuali
* Grafici bidimensionali
* Rappresentazioni tridimensionali
* La codifica dei testi
* La TEI (Text Encoding Initiative)
* Le varianti del testo
* La pre-edizione del testo
* Norinalizzazione grafica



* Marcatura del testo
* Perché marcare i testi
* Tipi generali di marcatura
* CoCoA
* WordCruncher
* TEI
* Tact
* Beta coding
* La codifica dei caratteri: da ASCII a Unicode Unicode
* Ambienti di lavoro capaci di gestire i caratteri di varie lingue
* La lemmatizzazione
* Che cosa è
* I vantaggi e i limiti
* Analisi che utilizzano la lemmatizzazione
* Una verifica sperimentale
* L'interpretazione dei dati di frequenza
* La pesatura delle frequenze
* Il test del X2
* Lo z-score
* Altri test statistici
* Dati di riferimento
* Considerazioni dal punto di vista tecnico
* Considerazioni dal punto di vista assiologico: il mutamento nei tempi del lavoro
* Dalla tradizione all'accelerazione
* Accelerazione del lavoro individuale
* Accelerazione globale: le reti di computer
* Valutazioni critiche

I metodi dell'analisi del testi assistita da computer
* Chiarimenti preliminari
* Si può misurare lo stile di un testo?
* Metodi per evidenziare le specificità dei testi
* Concordanze
* Tipi particolari di concordanze
* Analisi stilometriche
* Le entità distinguibili e misurabili
* Entità teoriche
* Metaparole
* Sequenze di caratteri
* Rime
* Entità reali
* Forme
* Co-occorrenze (collocates)
* Aree lessicali
* Segmenti ripetuti
* Analisi delle corrispondenze

SECONDA PARTE - UN POSSIBILE PERCORSO OPERATIVO

Il reperimento del testi
* Diversi tipi di testi
* La scelta delle fonti
* Le basi di dati testuali
* Su supporto magnetico
* Oxford Text Archive
* Corpora testuali in lingua corrente
* Brown Corpus
* Birmingham Corpus
* LOB Corpus
* Su Cd-Rom
* Letteratura Italiana Zanichelli
* English Poetry Full Text Database
* Shakespeare
* Library of The Future
* Gutenberg
* Su Internet
* Il problema dei diritti d'autore
* Lo scanner
* La battitura da tastiera

Programmi per l'analisi del testi
* La cassetta degli attrezzi
* Statistiche descrittive MTAS
* Concordanze, co-occorrenze
* Concordanze statiche (su carta)
* Concordanze dinamiche (elaborazioni a video)
* Tact
* FreeText
* WordCruncher
* MacConcordance
* Concorder
* HyperBase
* Ricerca di co-occorrenze
* Wdclust
* Tact con la funzione ColIGen
* Segmenti ripetuti in SPAD.T
* Collazione di manoscritti
* Collate
* PAUP
* Tustep
* L'analisi delle corrispondenze
* SPAD.N e SPAD.T
* L'analisi del contenuto
* Analisi morfosintattiche
* Pc-Kimmo e programmi collegati
* Altri programmi per analisi morfosintattiche
* Programmi per marcatura e analisi di parti del testo
* Fonti di informazione su testi e programmi Libri
* Riviste e periodici
* Liste
* Il gopher del Cisi dell'Università di Torino

TERZA PARTE - SPECIFICITÀ DELL'AMBITO FILOLOGICO CLASSICO

I testi scritti in greco e latino
* Particolarità legate alle lingue classiche
* I caratteri greci
* Le basi dì dati
* TLG (Thesaurus Linguae Graecae)
* PHI (Packard Humanities Institute)
* Duke Documentary Papyri
* Aureae Latinitatis Bibliotheca
* TLL (Thesaurus Linguae Latinae)
* Patrologia Latina Database
* CLCLT (Cetedoc Library of Chnstian Latin Texts)
* Libellus
* Altre basi di dati
* Programmi per lemmatizzare il greco e il latino LemLat/SIL
* PC-Morph
* Morpheus
* Concordanze dinamiche
* LBase
* TLGWorkplace
* PHI Workplace Musaios
* Pandora
* SNS Greek & Latin
* TLG Engine Lexis
* Il progetto Perseus


Un caso modello per il greco: Il problema dell'attribuzione della Athenaion Politeia
* Definizione dello scopo della ricerca
* I presupposti di questa ricerca
* I dati
* Il metodo: l'analisi delle corrispondenze
* La prima fase della ricerca
* La codifica dei dati
* L'analisi di dati relativi a categorie grarnmaticali specifiche

* L'analisi di una matrice di dati relativi a nomi, congiunzioni, particelle, verbi
* La seconda fase della ricerca
* L'analisi di una matrice di dati relativi all'intero lessico del corpus
* La riduzione delle dimensioni della matrice
* Conclusioni

APPENDICE

La rete lnternet: servizi utili per gli umanisti
* Come ci si collega a Internet
* Reperire testi e programmi su Internet Archie e FTP
* Gopher
* Ricerca nel gopherspace
* Il gopher del Cisi dell'Università di Torino
* Consultazione di banche dati testuali remote
* Consultazioni di cataloghi librari remoti
* Humanist e liste a tema (per filosofi, storici, ecc.) Iscrizione a riviste elettroniche

Bibliografia

Indice del nomi e degli argomenti



Potrebbero interessarti anche