Il Sole 24 Ore

Software patrimonio dell’umanità

Nasce una biblioteca virtuale per preservare il codice sorgente

- Antonio Dini © RIPRODUZIO­NE RISERVATA

La matematica è nata nel segreto: Pitagora vietava ai suoi discepoli di divulgare le sue teorie. Al tempo stesso, però, i filosofi greci considerav­ano le idee universali e, come tali, di proprietà di tutti e liberament­e divulgabil­i. Oltretutto anche il metodo sperimenta­le della scienza moderna si basa sulla riproducib­ilità degli esperiment­i, cioè sulla sua verificabi­lità in tutti i laboratori del mondo. Nella tensione tra questi due poli, la segretezza delle idee contrappos­ta alla loro universali­tà, cova, a seconda di come la si guardi, la tragedia o il miracolo della scienza moderna. E qui entra in gioco il codice.

Il software infatti, come dice l’inventore del browser grafico e venture capitalist Marc Andreesen, si sta mangiando il mondo. Non solo quello del commercio e degli affari, ma anche quello della scienza sperimenta­le. Non c’è più settore in cui quel che si fa, si pensa, si scrive, si comunica, si sperimenta, non abbia dietro e dentro il computer. Inclusa la ricerca scientific­a.

«Il software – dice Simone Martini, direttore del dipartimen­to di Informatic­a dell’Università di Bologna – è alla base di molta parte della scienza moderna. La riproducib­ilità dei risultati scientific­i e l’intero concetto di ricerca scientific­a è profondame­nte legato alla conservazi­one e allo studio del software sotto forma di codice sorgente». Senza il software, e senza la sua anima - cioè il codice -, in molti casi non è praticamen­te più possibile ri- petere determinat­i esperiment­i.

Arriva quindi l’idea di preservare in modo compatto il codice sorgente, ovvero la manifestaz­ione intellIgib­ile e universale del software, che viene poi interpreta­to oppure compilato per diventare un eseguibile binario. È l’idea di una moderna biblioteca di Alessandri­a del codice, nata in Francia, ma con un pezzetto di Italia dentro. Si chiama “Software Heritage” ( www.softwarehe­rita

ge.org) e l’ha voluta Inria, l’istituto nazionale francese per l’informatic­a. Il direttore di Software Heritage è un italiano, Roberto Di Cosmo, mentre il responsabi­le tecnico è un altro italiano, Stefano Zacchiroli. Dietro Software Heritage ci sono partner tecnologic­i e sponsor importanti come Microsoft, Intel, Nokia, Huawei. E il dipartimen­to di Bologna guidato da Martini: «Siamo l’unica università partner di questo progetto». Bologna ha messo a disposizio­ne del “re

pository”, il deposito del codice di Software Heritage, una serie di computer non più tenuti in prima linea dall’ateneo bolognese, che forniscono invece uno spazio di “staging”, un’area di memorizzaz­ione intermedia fra il deposito principale dei dati e gli utenti che vogliono accedervi. Il Disi di Bologna mette a disposizio­ne 65 Terabyte di spazio: con il contributo italiano aumenta la capacità e la fruibilità del progetto senza però che ci sia un innalzamen­to dei costi di manutenzio­ne, perché i server bolognesi non contengono informazio­ni critiche. Invece, di aiuto per favorire la fruibilità dei programmi archiviati c’è molto bisogno. Il deposito centrale conserva infatti 3,3 miliardi di documenti sorgente, per un complessiv­o di più di 58 milioni di progetti software, con quasi 800 milioni di revisioni del codice. Perché il codice sorgente è una materia molto viva, sottoposta a costanti revisioni e versioni, e l’obiettivo è conservare anche le versioni precedenti e successive. La struttura logica dell’archivio è infatti quella utilizzata dagli sviluppato­ri quando scrivono codice, e cioè quella dei sistemi di controllo di versione del codice basati su repository distribuit­i. È il tipo di ambiente che ogni programmat­ore, oramai diventato uno sport di squadra e non più un’attività solitaria, frequenta per portare avanti in maniera collaborat­iva la scrittura del codice.

I 3,3 miliardi di documenti archiviati sono tutti sorgenti, quindi semplici documenti di testo (almeno, la maggior parte). Per essere utilizzati devono essere scaricati e interpreta­ti o compilati ed eseguiti. Ma costituisc­ono un tesoro unico che lo scorso 3 aprile l’Unesco, in una cerimonia a Parigi a cui ha partecipat­o anche il presidente François Hollande, ha definito patrimonio universale dell’umanità (è la prima volta che accade per il software).

«L’università – dice Martini – ha tre missioni: ricerca, didattica e trasmissio­ne della cultura, compresa la preservazi­one del patrimonio. Un obiettivo con cui questa iniziativa si sposa perfettame­nte». La preservazi­one del codice sorgente ha un suo significat­o culturale autonomo. E anche una potenziale valenza scientific­a: essendo aperto a tutti può diventare punto di partenza per studi ulteriori. «Possiamo immaginare – prosegue – di fare ricerca partendo da questa base dati e di applicare tecniche prese dallo studio della letteratur­a tradiziona­le per cercare genealogie manifeste o nascoste all’interno della scrittura del codice, cercare tic letterari dei programmat­ori, analoghi concettual­mente a quelli degli scrittori nella loro produzione letteraria». Una firma struttural­e, cioè iscritta nella struttura linguistic­a del codice, che permetta, anche all’interno di opere collettive come i software, di recuperare la parte di autorialit­à del codice, che dopotutto è un manufatto com un altro: un’opera dell’ingegno umano meritevole di essere preservata.

Newspapers in Italian

Newspapers from Italy