Conteúdo / Main content
Menu Rodapé
  1. Início
  2. Cursos
  3. Tecnologias e Sistemas da Informação
  4. Pesquisa e Publicação de Informação

Pesquisa e Publicação de Informação

Código 6634
Ano 2
Semestre S1
Créditos ECTS 6
Carga Horária PL(30H)/T(30H)
Área Científica Informática
Tipo de ensino Presencial.
Estágios Não aplicável.
Objectivos de Aprendizagem Os alunos começam por adquirir competências no âmbito da definição de linguagens de marcação (XML, DTD, XSL, XSLT) para fins específicos. Posteriormente, deverão familiarizar-se com a tecnologia subjacente à criação e manutenção de motores de pesquisa, para grandes colecções de documentos. São estudados dois módulos fundamentais e interligados: A publicação e recuperação de informação no contexto da actual era digital. Começamos por focar na representação, validação e transformação de informação, através de linguagens de marcação. Deverão ser adquiridas competências no âmbito da definição de linguagens de marcação para finalidades próprias. O segundo modulo trata de questões inerentes ao domínio da "Pesquisa de Informação", com especial ênfase à tecnologia envolvida na criação de motores de pesquisa para grandes colecções de documentos, possivelmente interligados, tal como na World Wide Web. São estudados algoritmos fundamentais de indexação e pesquisa, para estes ambientes.
Conteúdos programáticos Parte I - Publicação de Informação
1.1 Linguagens de marcação SGML, XML.
1.2 Exemplos de linguagens XML: XHTML, SVG, MathML e RSS.
1.3 Validação de documentos XML utilizando uma DTD.
1.4 Validação de documentos XML utilizando XML-Schema (XSD).
1.5 Estilização de documentos XHTML e XML através de CSS.
1.6 Linguagens de transformação para XML: XSL e XSL-FO.

Parte II - Pesquisa de Informação
2.1 Modelos matemáticos para representação de colecções de documentos de texto. Modelos Booleanos e de Espaços Vectoriais.
2.2 Indexação e pesquisa de documentos de texto.
2.3 Avaliação de sistemas de Pesquisa de Informação.
2.4 Operações sobre “Queries”: Expansão de queries.
2.5 Pesquisa na WWW - “Web Search”
2.6 “Link Analysis” - Análise topologia de um grafo de documentos “hiperligados” para determinação de relevância documental.
2.7 Exploração de métodos relevantes do PLN para a Pesquisa de Informação: Aglomeração e Categorização documental.
Metodologias de Ensino e Critérios de Avaliação -Avaliação de conhecimentos (AC) 10 valores. (1 teste, 10 valores)
-Avaliação teórico e pratico (AT) 8 Valores. (1 Trabalho do Grupo de 3/4 Alunos)
-Avaliação contínua das aulas praticas (AP) 2 valores. (4 fichas de Exercícios de Programação)

Classificação Final CF = AC + AT + AI
Admissão a exame Final. CF >= 6

Frequência: 4 de Janeiro de 2016
Bibliografia principal Bibliografia Principal

D. A. Grossman, O. Frieder, Information Retrieval Algorithms and Heuristics, Kluwer, Boston, 1998, ISBN: 0-7923-8271-4
R. Baeza-Yates & B. Ribeiro-Neto, Modern Information Retrieval, Addison Wesley, New York, 1999, ISBN: 0-201-39829-X
Elliotte Rusty Harold, W. Scott Means, XML in a Nutshell, O'Reilly 2004, ISBN 0-596-00764-7


Bibliografia Secundária

M. Crochemore & W. Rytter, Jewels of Stringology, World Scientific Pub Co, 2002, ISBN: 9810247826
D. Jurafsky et al, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, Prentice Hall, 2000, ISBN: 0130950696
C.D. Manning & H. Schütze, Foundations of Statistical Natural Language Processing, MIT Press, 1999, ISBN: 0262133601

Sal Mangano, XSLT Cookbook, Second Edition, O'Reilly 2006, ISBN 0-596-00974-7
Dave Pawson, XSL-FO - Making XML Look Good in Print, O'Reilly 2002, ISBN 0-596-00355-2
Língua Português
Data da última atualização: 2012-05-24
As cookies utilizadas neste sítio web não recolhem informação pessoal que permitam a sua identificação. Ao continuar está a aceitar a política de cookies.