Este trabalho apresenta o Banco CE-DOHS – Corpus Eletrônico de Documentos Históricos do Sertão, na sua primeira etapa, que abrange o período que vai de 1750 a 2000, caracterizado pelo multilinguismo localizado. O CE-DOHS é a versão eletrônica –com textos editados em linguagem xml – do banco DOHS, do projeto Vozes do Sertão em Dados: história, povos e formação do português brasileiro, com textos em edição semidiplomática, além de amostras orais. A edição eletrônica é feita, no âmbito do CE-DOHS, usando o eDictor, desenvolvido por Paixão de Sousa, Kepler e Faria (2010); trata-se de um editor de textos especialmente voltado ao trabalho filológico e à análise linguística automática. Finalizada a primeira etapa, no ano de 2018, o banco CE-DOHS tem mais de um milhão de palavras, colaborando, de maneira muito significativa, com o Projeto Nacional para a História do Português Brasileiro (PHPB), do qual é parceiro.
Este documento presenta el Banco EC-DOHS - Corpus de Documentación Electrónica de Sertão, en su primera etapa, que abarca el período de 1750 a 2000, caracterizado por el multilingüismo localizado. CE-DOHS es la versión electrónica, con textos editados en lenguaje XML, del banco DOHS, del proyecto Vozes do Sertão en pueblos y formación del portugués brasileño, con textos en edición semidiplomática y muestras orales. La edición electrónica se realiza, en el marco de CE-DOHS, utilizando eDictor, desarrollado por Paixão de Sousa, Kepler y Faria (2010); Es un editor de texto enfocado especialmente en el trabajo filológico y el análisis lingüístico automático. Después de la primera fase, en 2018, el banco CE-DOHS tiene más de un millón de palabras, colaborando de manera muy significativa con el Proyecto Nacional de Historia del Portugués Brasileño (PHPB), del cual es socio.