El Repertori Electrònic de Textos Orals Catalans (RETOC) és un corpus de veu digitalitzada, parcialment transcrita i accessible universalment a través dInternet, actualment operatiu, però encara millorable, pel que fa a les funcions de consulta i a les de desenvolupament (tractament de les mostres, transcripció o/i sincronització). La versió actual és multiplataforma i funciona a partir deines públiques com el llenguatge de programació PERL i el laboratori fonètic virtual Praat; i té, a més, lavantatge que el 95% del treball de constitució dels corpus es pot fer de manera cooperativa a través dInternet.
Fonamentalment, hi ha conferències de nivell universitari i enregistraments de mitjans de comunicació oral, organitzats en subcorpus a través dels quals pots accedir a cada enregistrament.. Pel que fa al nombre dhores, totes accesibles, en podeu consultar líndex general. La previsió és que la infraestructura actual ens permetrà acumular-ne fins a 1800h, amb una estimació de més de 15M de mots.
Aquest projecte embrionari sha pogut desenvolupar sobretot gràcies a la relació amb el projecte
DOPO
(Diagnòstic Ortològic per Ordinador) de col·laboració del Laboratori de Tecnologies Lingüístiques (LATEL) amb la Unitat dAssessorament Lingüístic (UAL) de Catalunya Ràdio, projecte que nha finançat una part molt important.