Settori
Nell’ambito di una generale classificazione delle iniziative di settore si può osservare che la sperimentazione di un approccio informatico nel settore delle discipline umanistiche accoglie due percorsi di indagine. Da un lato assume il punto di vista delle discipline umanistiche e il conseguente impiego di metodologie informatiche è specifico per settore scientifico “tradizionale”; dall’altro lato ragiona in base agli aspetti “computabili” delle scienze umane. Un primo livello per la categorizzazione va definito quindi sul piano della applicazione - in senso non esclusivamente tecnico e strumentale, ma anche teorico e metodologico - di modelli informatici specifici per le esigenze del settore umanistico (e.g. linguistica, filologia, archivistica, biblioteconomia e bibliografia, storia, archeologia, filosofia, critica della letteratura). Ogni ambito, che possiamo definire umanistico in senso lato, individua strumenti che possono esaudire esigenze disciplinari. Per fare solo qualche semplice esempio, la filologia userà principalmente strumenti per la realizzazione di un’edizione critica, mentre l’archeologia si avvarrà di sistemi di ricostruzione virtuale, o ancora l’archivistica prediligerà strumenti per l’implementazione di basi di dati utili a strutturare strumenti di corredo, mentre la linguistica o la critica della letteratura useranno linguaggi formali per l’annotazione dei documenti. Parleremo in questo caso di “informatiche umanistiche disciplinari” . Dall’altro lato, possiamo dire che la classificazione delle iniziative in materia di IU ragiona sui settori della computazione, si concentra cioè sui diversi momenti della formalizzazione informatica degli oggetti umanistici. Fra questi ricordiamo i principali. In prima battuta sono sicuramente fra i più utilizzati i sistemi di markup (principalmente a base XML/TEI, ma senza escludere il ricorso ad altri schemi) e le correlate procedure di text processing (e conseguente information retrieval). Molto diffuse le pratiche legate all’analisi del testo, fra cui annoverare non solo il text retrieval (indici, frequenze, concordanze), ma anche i sistemi di annotazione finalizzati alla text analysis e quindi al natural language processing (con obiettivi di information extraction legati a procedure di text mining). Dietro ai sistemi di markup e ai processi di analisi del testo il più delle volte non manca la riflessione sulla definizione di modelli di dati (concettuali e logici) e quindi la progettazione e lo sviluppo di basi di dati. Un altro settore che sempre di più domina nel panorama dell’IU è quello legato alla elaborazione di modelli concettuali legati alla creazione o all’utilizzo di ontologie di dominio, nell’ottica delle tecnologie e delle applicazioni del Web Semantico (sistemi di estrazione della conoscenza). E sicuramente non manca la riflessione sugli standard per i metadati, ai diversi livelli della rappresentazione digitale, e, in tempi più recenti, la creazione di ambienti e infrastrutture per il riversamento di oggetti digitali, in modo particolare biblioteche digitali e archivi aperti