Acervo Estadão é disponibilizado na rede


06/06/2012


O Estado de S. Paulo, mais antigo jornal da cidade de São Paulo ainda em circulação, foi fundado em 4 de janeiro de 1875, com o nome A Província de São Paulo por um grupo defensor do fim da monarquia e da escravidão no Brasil. Os 137 anos de história do Estadão estão disponibilizados ao público na internet desde o último dia 23. O Acervo Estadão, nesta primeira fase, reúne 2,4 milhões de páginas e 200 mil fotografias publicadas na íntegra desde a primeira edição do periódico.
 
Grandes temas que marcaram a história do Brasil e do mundo fazem parte da documentação, com destaque para as matérias inéditas censuradas pela ditadura militar e substituídas, à época, pela publicação de poemas de Luís de Camões e receitas culinárias.
 
O projeto pretende colaborar com o trabalho de pesquisadores, historiadores, estudantes e do público em geral. Para tanto, o Grupo Estado firmou convênios com bibliotecas e instituições de ensino públicas e particulares, em todos os níveis, a fim de garantir o pleno acesso às consultas. O conteúdo será periodicamente editado para que o usuário encontre informações atualizadas.
 
O trabalho de digitalização do Acervo Estadão teve início em 2010, com a colaboração de dezenas de profissionais de diversas áreas do conhecimento, que viabilizaram a passagem do acervo em papel para arquivo digital. O Grupo Estado empregou recursos tecnológicos de ponta, além da experiência arquivista de dezenas de pessoas na garimpagem e recuperação de um sem número de microfilmes e páginas originais de edições centenárias em papel. O processo incluiu o processamento das imagens, reconhecimento de textos, hospedagem do site, ferramentas de busca, digitalização das páginas, esta última realizada por uma consultoria externa sob a coordenação da equipe do jornal.
 
A conversão ortográfica também foi uma etapa importante na digitalização do acervo, exigindo o trabalho de adaptação de grafia, indexação, banco de dados. A Universidade de São Paulo (USP) contribuiu para estas atividades fornecendo o dicionário feito pela professora Márcia Moisés Ribeiro, do Instituto de Estudos Brasileiros, da instituição, além da Biblioteca Nacional (FBN) e da Biblioteca Mário de Andrade, que reúnem em seus acervos microfilmes de edições antigas do jornal.
 
Todos os usuários da rede terão acesso ao conteúdo completo num prazo de 30 dias. Após esse período, a consulta será restrita a algumas páginas. Assinantes do jornal e do site do Estadão terão acesso livre a todas as páginas.
 
Na entrevista a seguir, o coordenador do Acervo Estadão, Edmundo Leite, fala sobre os desafios de transformar mais de um século de história e informação impressa em minucioso arquivo digital com fatos e imagens que ajudaram a construir parte da História.
 
ABI Online- Quando teve início o projeto de digitalização do acervo do Estadão e qual o objetivo?
Edmundo Leite- O projeto agora entregue teve início em 2010.  Mas a digitalização do Acervo já estava em pauta há muito tempo. Somente a partir de 2010 foram reunidas as condições necessárias para que os trabalhos fossem iniciados da maneira como o Grupo Estado considerava adequado. Antes de iniciar o trabalho, houve um grande tempo de planejamento para definir o melhor modelo de tecnologia e de formato do produto, já que os objetivos do projeto eram vários: preservar os originais em papel; compartilhar o conteúdo produzido nesses 137 anos com os profissionais dos veículos, facilitando a busca por informações que complementem e melhor contextualizem os atuais conteúdos feitos pelos jornalistas; compartilhar esse conteúdo com os leitores e com a sociedade, pois o Grupo Estado entende que se trata de um conteúdo de relevância histórica sem igual no País  
 
ABI Online- Quantas pessoas estiveram envolvidas no projeto? De que áreas?
Edmundo Leite- Foram cerca de 60 profissionais de diferentes áreas, sobretudo as de tecnologia e de jornalismo. Nas diferentes fases do trabalho, equipes reuniram jornalistas, historiadores, arquivistas, bibliotecários, designers, publicitários, educadores, técnicos, programadores e engenheiros na construção de um ambiente digital para o acervo.
 
ABI Online- Qual foi o maior desafio ao longo do trabalho?
Edmundo Leite- Garantir a qualidade de leitura das páginas no formato digital. Para isso, foi preciso selecionar as melhores amostras de microfilmes, a matriz do processo de digitalização, disponíveis em diferentes acervos: no nosso, na Biblioteca Nacional e no Arquivo Público do Estado de São Paulo. Um padrão de qualidade foi estabelecido para que a cópia digital extraída do microfilme atendesse a vários critérios técnicos. Quando esse padrão não era atingido, partíamos para uma nova microfilmagem, de modo que tivéssemos um arquivo digital de qualidade.
 
ABI Online- Que recursos tecnológicos viabilizaram a realização do projeto?
Edmundo Leite- Vários tipos de tecnologias tiveram que ser acionadas. Utilizamos técnicas de três séculos. Do antigo papel, passando pelo microfilme e chegando às modernas buscas digitais. O principal recurso tecnológico em termos de busca é OCR (Optical Character Recognition), o reconhecimento ótico de caracteres. É um tipo de software que reconhece letras nas páginas e permite, com isso, a busca por palavras ou termos. Sem esse recurso, as páginas digitalizadas do jornal seriam apenas imagens a serem vistas e lidas com o olho humano. A maior parte dos recursos usados é open source, de código aberto. Várias ferramentas que melhoram performance do buscador, por exemplo, foram incorporados. Recorremos ao Instituto de Estudos Brasileiros (IEB), da USP, que nos forneceu dicionários de grafias antigas por eles digitalizados para incorporamos ao nosso buscador. São esses dicionários que permitem encontrar ocorrências da palavra “pharmacia” mesmo quando se digita “farmácia”. Isso era fundamental, pois o jornal começou a circular em 1875 quando grafia era outra e nesses 137 anos passou por várias reformas ortográficas formais e pelas transformações informais da língua portuguesa.
 
ABI Online- Existe algum acervo de imprensa semelhante ao do Estadão? Qual?
Edmundo Leite- Mesmo com alguns jornais mais antigos que o Estadão (O Diário de Pernambuco foi fundado 50 anos antes do Estadão, em 1825, e Jornal do Commércio, do Rio de Janeiro, em 1827), ainda em circulação, não existe um acervo tão vasto e relevante como o nosso.  Das páginas do Estadão saiu um clássico da literatura mundial: “Os Sertões”, de Euclides da Cunha. O escritor já colaborava com o jornal e foi enviado por Júlio Mesquita para cobrir o conflito de Canudos,  no sertão baiano. Sua série de reportagens, a vivência em Canudos, fez com que tivesse o material para escrever o livro alguns anos depois. Poucos jornais no mundo podem se orgulhar de algo assim. O artigo de Monteiro Lobato publicado no Estadão criticando Anita Malfatti em 1917 resultou, cinco anos depois, na Semana de Arte Moderna de 1922. Grandes intelectuais e escritores iniciaram suas carreiras ou tiveram seus textos publicados pela primeira vez nas páginas do Estadão, no “Suplemento Literário”, por exemplo. Então não é apenas uma questão de longevidade. O jornal foi um agente da história. Nasceu abolicionista e republicano no meio de uma monarquia. Lutou por essas causas e as noticiou. Além dos arquivos do Estadão, temos o acervo completo do Jornal da Tarde, que começou a circular em 1966 e desde então revoluciona a maneira de se fazer jornalismo. Há também uma série de publicações extras do próprio Estadão, como o Estadinho, edição vespertina e noturna que circulou durante os dois períodos de guerras mundiais, o Suplemento em Rotogravura, uma revista fotográfica impressa em papel especial que circulou de 1928 a 1944, as edições de Esportes que circulavam às segundas-feiras durante vários anos, almanaques e outras publicações editadas pelo Estado. Todas essas edições estarão contempladas nas próximas fases da digitalização.  E ainda temos organizados um conjunto de publicações de outros veículos que não mais existem e que são fundamentais para pesquisadores, acadêmicos e para a própria redação entender e contar fatos do passado que a até hoje nos influenciam.
 
ABI Online- De que forma será feita a atualização das informações?
Edmundo Leite- A atualização das edições será constante. Cada nova edição publicada é incorporada automaticamente ao Acervo. Mas isso é um processo tecnológico natural, é um acervo em permanente construção. O importante é o uso que fazemos desse acervo. Não se trata apenas de uma ferramenta para encontrar edições antigas. O Acervo foi pensado como um novo canal de informações. Diariamente, fazemos conexões de notícias do passado com os fatos atuais noticiados pelo jornal. No dia do lançamento do Acervo, por exemplo, quando seria natural colocar a primeira página publicada pelo jornal, em 4 de janeiro de 1875 em destaque, optamos por destacar uma página de 1974 sobre a inauguração do Metrô em São Paulo, pois naquele dia acontecia uma greve dos metroviários que parou a cidade. A primeira frase da reportagem de 38 anos atrás não poderia ser mais apropriada: “O Metrô hoje está proibido para a população”. Não se trata apenas de saudosismo. Muita coisa do passado ajuda a compreender os acontecimentos de hoje. Não vai demorar a surgir uma informação nova das centenárias páginas do jornal.
 
ABI Online- Como está sendo o retorno do público neste primeiro momento?
Edmundo Leite- Fantástico. Estamos recebendo várias manifestações emocionadas de leitores que encontram coisas que jamais conseguiriam se não fosse a digitalização. Desde menções aos pais, avós e bisavós a notícias sobre suas vidas, os lugares em que viveram, o tema da pesquisa para o trabalho acadêmico. Algumas mensagens são tocantes. As pessoas agradecem por poderem reviver algo ou lerem de novo um texto que adoraram, mas ficou só na memória.
 
ABI Online- Qualquer pessoa poderá ter acesso às informações?
Edmundo Leite- No primeiro mês, sim. Todos poderão acessar, mas é preciso fazer um cadastro. Após o primeiro mês, somente os assinantes terão direito a ver as páginas ampliadas. Mas estamos fazendo convênios com várias instituições públicas para que o acesso ao Acervo Estadão seja pleno aos usuários desses locais. As primeiras instituições conveniadas serão a Biblioteca Nacional, a Biblioteca Brasiliana Guita e José Mindlin da USP, a própria USP e outras universidades estaduais, como a UNESP e a Unicamp, além do Arquivo Público do Estado de São Paulo e a Biblioteca Mário de Andrade e todas as bibliotecas do Sistema Municipal de Bibliotecas. Esses convênios serão ampliados mais adiante para que mais estudantes e pesquisadores possam usufruir desse patrimônio cultural brasileiro.
 
ABI Online- Entre as notícias registradas ao longo de 137 anos de histórias, quais chamaram mais a atenção da equipe?
Edmundo Leite- O entusiasmo tem sido tão grande que tem horas que precisamos nos conter tamanha a vontade de compartilhar tudo o que tem de bacana ali dentro. Uma hora alguém lê um texto do Carlos Drummond de Andrade no “Suplemento Literário”, dali a pouco alguém mostra uma notícia sobre o Pelé ou outro jogador de futebol ainda no início da carreira. Encontramos os primeiros registros de vitória de Ayrton Senna nas categorias menores do kart, em 1974, tem as páginas censuradas, que sempre causam espanto. É tanta coisa que seria preciso uma homepage maior que a do Estadão.com.br para dar conta de tudo isso. Mas o que mais chama atenção e emociona  até hoje é o belíssimo texto da notícia sobre a abolição da escravidão no Brasil publicado na edição de 15/5/1888. É de arrepiar: “Já não há mais escravos no Brazil. A lei n. 3353 de 13 de maio de 1888 assim o declara no meio de festas que se estendem por todo o paiz, para honra e glória desta nação da America. Desde hontem está em vigor o excepcional Decreto da soberania nacional que a princesa regente, em nome do imperador, sanccionou e seus ministros o fizeram publicar. Ahi está uma victoria esplendida da opinião, a affirmação de quanto pode um povo quando sabe fazer valer a sua vontade…”
 
ABI Online- Que outros projetos de digitalização de acervo serão implementados pelo Grupo Estado?
Edmundo Leite- Ainda estamos definindo o cronograma, mas nas próximas fases serão digitalizados o Jornal da Tarde, o gigantesco arquivo fotográfico, o Suplemento em Rotogravura, as duas fases do Estadinho nas guerras mundiais e os arquivos de áudio da rádio e gravadora Eldorado, que contém registros importantes de artistas que fizeram história na música brasileira.