GUIA DO PROFESSOR

Caro professor, caso tenha algum questionamento de qualquer natureza, não hesite em nos contactar pelo e-mail:

conteudosdigitais@im.uff.br



DESCRIÇÃO

Com o advento da internet, o avanço da ciência e a interação entre povos de línguas diferentes, mais e mais dados são gerados em forma de texto. Extrair informações relevantes e identificar padrões nesta massa de dados constituem desafios tecnológicos atuais. Problemas desta natureza são estudados em campos de pesquisa como mineração de texto (text mining) e linguística computacional. Neste contexto, a estatística se estabelece como uma ferramenta fundamental e indispensável. Nesta atividade, você poderá experimentar o uso de conceitos básicos de estatística na análise de sequências de caracteres (a “ponta do iceberg” das técnicas e ideias que são empregadas).

O primeiro módulo permite codificar/decodificar um texto usando a técnica de permutação das letras. Para o processo de decodificação, está disponível um recurso que permite contar o número de letras do texto. A partir da distribuição de frequência resultante, o usuário pode estabelecer estratégias para descobrir a chave de decodificação.

O segundo módulo conta o número de letras, dígitos, acentos, sinais de pontuação, palavras e períodos de um texto (que pode estar em português, inglês, espanhol, francês ou alemão). Ele também calcula o número de letras por palavra e o número de palavras por período (apresentando média, mediana, moda, variância e desvio padrão destas variáveis quantitativas), os períodos mais longos, os períodos mais curtos, as palavras mais longas e as palavras mais curtas.

O terceiro módulo calcula a frequência das palavras de um texto oferecendo um ambiente conveniente para o estudo da Lei de Zipf. Esta lei, proposta pelo professor de linguística George Kingsley Zipf (1902-1950) da Universidade de Harvard, propõe que, em um texto com um número grande de palavras, a frequência f de ocorrência de uma palavra como uma função da posição r deste evento em uma lista ordenada pela frequência de ocorrência é dada por uma lei de potências.

O quarto módulo analise o crescimento do vocabulário em um texto, isto é, ele exibe, através de um gráfico, qual é o número de palavras diferentes em função do número de palavras lidas do início até o final do texto.

O quinto módulo apresenta um recurso gráfico (usado principalmente na internet) para descrever os termos mais frequentes de um determinado texto. O tamanho da fonte em que a palavra é apresentada é uma função da frequência da palavra no texto: palavras mais frequentes são desenhadas em fontes de tamanho maior, palavras menos frequentes são desenhadas em fontes de tamanho menor.


OBJETIVOS

Oferecer um ambiente interativo no qual o aluno pode apreciar e usar a estatística como um conjunto de ideias e procedimentos que permitem aplicar a matemática em questões do mundo real, no caso, no processamento de textos em vários idiomas.


QUANDO USAR?

Sugerimos que a atividade seja usada quando da apresentação dos conceitos estatísticos (população, tabelas de frequências e seus gráficos, medidas de posição e medidas de dispersão).


COMO USAR?

Decidir como usar o computador é uma questão que depende de alguns fatores: número de alunos na turma, número de computadores disponíveis no laboratório de informática e tempo disponível em sala de aula. Em virtude disto, vamos sugerir três estratégias de uso desta atividade:

1.

Como um exercício extraclasse.

Nesta modalidade, você pode propor a atividade para seus alunos como um dever de casa (valendo um ponto extra), para ser realizado fora do tempo de sala de aula, isto é, em um horário livre no laboratório da escola ou na própria casa do aluno, caso ele possua um computador. Você pode definir um prazo pré-determinado para a realização da atividade (por exemplo, uma semana). Achamos que não é preciso que você explique o funcionamento do software da atividade, pois incluímos uma animação ilustrando todos os seus recursos. Naturalmente, no decorrer do prazo do dever de casa, você poderá tirar dúvidas eventuais de seus alunos.

Para tornar o trabalho mais orientado e focado, recomendamos fortemente que o dever de casa seja conduzido através de algumas questões que os alunos deverão estudar com o auxílio do software da atividade. O formulário de acompanhamento do aluno, apresentado mais embaixo, sugere vários exercícios. Este formulário também será útil como instrumento para uma discussão posterior em sala de aula (quando da devolução do formulário) e fornecerá subsídios para uma possível avaliação.

2.

Em sala de aula com um projetor multimídia (datashow)

Se você tiver acesso a um projetor multimídia (datashow) ou a um computador ligado na TV, você poderá usar o software desta atividade em sala de aula para, por exemplo, ao invés de desenhar os poliedros no quadro, exibi-los e manipulá-los através do computador. Se houver tempo, mesmo alguns exercícios do formulário de acompanhamento do aluno poderão ser resolvidos em sala de aula sob sua orientação.

3.

Como uma atividade de laboratório sob a supervisão do professor.

A grande vantagem desta modalidade é que você poderá acompanhar de perto como os seus alunos estão interagindo com o computador. Sugerimos que você apresente o jogo aos alunos, resolvendo um dos desafios como exemplo e, a partir daí, deixe-os brincar livremente, intervindo apenas quando necessário.

Principalmente nas modalidades 1 e 3, recomendamos fortemente que o aluno preencha algum tipo de questionário de acompanhamento, para avaliação posterior. Sugerimos o seguinte modelo (sinta-se livre para modificá-lo de acordo com suas necessidades):

lpp-aluno.rtf.

Este formulário de acompanhamento do aluno também estará acessível na página principal da atividade através do seguinte ícone:

.

As respostas dos questionamentos propostos neste formulário não estão incluídas com a atividade, mas elas podem ser solicitadas através do e-mail conteudosdigitais@im.uff.br.


OBSERVAÇÕES METODOLÓGICAS

Relatos de experiências (comprovados em nossos testes) mostram que os alunos têm forte resistência em preencher o formulário de acompanhamento. Mais ainda: estes relatos mostram que, frequentemente, os alunos conseguem argumentar corretamente de forma verbal, mas enfrentam dificuldades ao fazer o registro escrito de suas ideias.

Mesmo com as reclamações e resistência dos alunos, nossa sugestão é que você, professor, insista no preenchimento do formulário. Afinal, por vários motivos, é muito importante que o aluno adquira a habilidade de redigir corretamente um texto matemático que possa ser compreendido por outras pessoas.


OBSERVAÇÕES TÉCNICAS

A atividade pode ser acessada usando a internet, através do link http://www.uff.br/cdme/lpp/ (endereço alternativo: http://www.cdme.im-uff.mat.br/lpp/). Se você preferir, solicite que o responsável pelo laboratório da escola instale a atividade para acesso offline, isto é, sem a necessidade de conexão com a internet.

O jogo pode ser executado em qualquer sistema operacional: Windows, Linux e Mac OS. Porém, para executá-lo, é preciso que o computador tenha a linguagem JAVA instalada. A instalação da linguagem JAVA pode ser feita seguindo as orientações disponíveis no seguinte link http://www.java.com/pt_BR/.

Atenção: se você estiver usando a atividade offline através de uma cópia local em seu computador, é importante que os arquivos não estejam em um diretório cujo nome contenha acentos ou espaços.

Importante: algumas distribuições Linux vêm com o interpretador JAVA GCJ Web Plugin que não é compatível com o applet da atividade. Neste caso, recomendamos que você solicite ao responsável pelo laboratório da escola que instale o interpretador nativo da Sun, disponível no link http://www.java.com/pt_BR/.

Acessibilidade: a partir da Versão 2 do Firefox e da Versão 8 do Internet Explorer, é possível usar as combinações de teclas indicadas na tabela abaixo para ampliar ou reduzir uma página da internet, o que permite configurar estes navegadores para uma leitura mais agradável.

Combinação de Teclas Efeito
Ampliar
Reduzir
Voltar para a configuração inicial

Vantagens deste esquema: (1) além de áreas de texto, este sistema de teclas amplia também figuras e aplicativos FLASH e (2) o sistema funciona para qualquer página da internet, mesmo para aquelas sem uma programação nativa de acessibilidade.


DICAS

1.

As atividades “Medidas de Posição” (link 1, link 2) e “Medidas de Dispersão” (link 1, link 2) fornecem uma excelente introdução aos conceitos estatísticos usados nesta atividade. Sugerimos que elas sejam realizadas primeiro.

2.

Se você tiver uma turma grande de alunos, ao invés de solicitar que todos analisem um mesmo texto, você pode pedir que cada um escolha textos diferentes com características literárias diferentes (letras de música, poemas, contos, livros, reportagens de jornal, etc).

3.

É importante enfatizar para seus alunos sobre a influência do tamanho e da qualidade da amostra (em nosso caso, textos) ao se construir afirmações baseadas em análises estatísticas. Por exemplo, ao se estudar a distribuição de frequência das letras na novela “La Carrozza com las Damas” do espanhol Alonso de Alcalá y Herrer, a letra “e” não aparece. Uma pessoa desavisada poderia concluir (erroneamente) que a letra “e” é rara ou ausente no espanhol. Isto acontece porque a amostra (a novela) é atípica: a novela foi escrita deliberadamente de forma a excluir a letra “e”.

4.

O aplicativo Wordle permite construir nuvens de palavras com um toque de arte. Ele não é gratuito e só pode ser acessado com uma conexão com a internet. Contudo, as imagens geradas pelo software são livres e podem ser usadas em camisetas, livros, páginas WEB, etc. A figura abaixo mostra a nuvem de palavras do discurso de posse do Presidente Barack Obama em 2008.


QUESTÕES PARA DISCUSSÃO APÓS A REALIZAÇÃO DA ATIVIDADE

Sugerimos fortemente que seja feita uma discussão com os alunos após a realização da tarefa. Se você optou por levá-los ao laboratório, isto pode ser feito no próprio laboratório, logo após o término da atividade. Se você optou por um exercício extraclasse, a discussão pode ser feita quando da devolução do questionário. Esta discussão pode incluir as diferentes estratégias de solução dos exercícios adotada por cada aluno, a comparação das respostas dos alunos, as dificuldades encontradas na realização dos exercícios, a ênfase em propriedades e resultados importantes, as informações suplementares, etc.


AVALIAÇÃO

Como instrumento de avaliação, sugerimos que você peça para os alunos elaborarem um relatório descrevendo as perguntas e respostas apresentadas na discussão em sala de aula. Nesse relatório, o professor poderá avaliar as capacidades de compreensão, argumentação e organização do aluno. Recomendamos que o questionário preenchido durante a realização da atividade seja anexado ao relatório.


REFERÊNCIAS

Bolshoy, A.; Volkovich, Z. (V.); Kirzhner, V., Barzily, Z. Genome Clustering – From Linguistic Models to Classification of Genetic Texts. Studies in Computational Intelligence, Springer-Verlag, 2010.

Grzybek, P. Contributions to The Science of Text and Language – Word Length Studies and Related Issues. Text, Speech and Language Technology, Springer-Verlag, 2006.

Hämmerlin, G.; Hoffmann, K.-H. Bilisoly, R. Practical Text Mining with Perl. Wiley Series on Methods and Applications in Data Mining, John Wiley & Sons, Inc., 2008.

Heift, T.; Schulze, M. Errors and Intelligence in Computer-Assisted Language Learning: Parsers and Pedagogues. Routledge Studies in Computer-Assisted Language Learning, Taylor & Francis Routledge, 2007.

Li, W. Information on Zipf's Law. The Robert S. Boas Center for Genomics and Human Genetics, Feinstein Institute for Medical Research, 2010.

MacKenzie, I. S.; Tanaka-Ishii, K. Text Entry Systems: Mobility, Accessibility, Universality. Morgan Kaufmann Publishers, 2007.

Manning, C. D.; Schütze, H. Foundations of Statistical Natural Language Processing. The MIT Press, 1999.

Mengue, J. K. Uma Coleção de Resultados sobre Números Normais. Dissertação de mestrado, Instituto de Matemática, Universidade Federal do Rio Grande do Sul, 2008.

Nugues, P. M. An Introduction to Language Processing with Perl and Prolog – An Outline of Theories, Implementation, and Application with Special Consideration of English, French, and German. Cognitive Technologies, Springer-Verlag, 2006.

Yamada, H. A Historical Study of Typewriters and Typing Methods: From The Position of Planning Japanese Parallels. Journal of Information Processing, v. 2, pp. 175–202, 1980.


[Clique aqui para voltar para a página principal!]

Dúvidas? Sugestões? Nós damos suporte! Contacte-nos pelo e-mail:
conteudosdigitais@im.uff.br.