Repertori   Electrònic   de Textos   Orals   Catalans

El Repertori Electrònic de Textos Orals Catalans (RETOC) és un corpus de veu digitalitzada, parcialment transcrita i accessible universalment a través d’Internet, actualment operatiu, però encara millorable, pel que fa a les funcions de consulta i a les de desenvolupament (tractament de les mostres, transcripció o/i sincronització). La versió actual és multiplataforma i funciona a partir d’eines públiques com el llenguatge de programació PERL i el laboratori fonètic virtual Praat; i té, a més, l’avantatge que el 95% del treball de constitució dels corpus es pot fer de manera cooperativa a través d’Internet.

Fonamentalment, hi ha conferències de nivell universitari i enregistraments de mitjans de comunicació oral, organitzats en subcorpus a través dels quals pots accedir a cada enregistrament.. Pel que fa al nombre d’hores, totes accesibles, en podeu consultar l’índex general. La previsió és que la infraestructura actual ens permetrà acumular-ne fins a 1800h, amb una estimació de més de 15M de mots.

Aquest projecte embrionari s’ha pogut desenvolupar sobretot gràcies a la relació amb el projecte DOPO (Diagnòstic Ortològic per Ordinador) de col·laboració del Laboratori de Tecnologies Lingüístiques (LATEL) amb la Unitat d’Assessorament Lingüístic (UAL) de Catalunya Ràdio, projecte que n’ha finançat una part molt important.

Per comentaris i observacions, poseu-vos en contacte amb Lluís de Yzaguirre i Maura

Pàgina servida per Apatxe