documents into sub-collections of related documents. Agrupamento Mtodo para reduzir uma coleo de documentos em subcolees de documentos relacionados. Contradiction Operator Merging Operator which addresses incompatible differences in values of a common slot in two templates, each representing the semantic content of an article. Operador de Contradio Operador de Fuso que trata diferenas de valores incompatveis de uma lacuna (slot) comum a dois modelos (templates), cada um representando o contedo semntico de um artigo. Cosine Similarity Coefficient A very widely used vocabulary overlap measure, based on a vector space model. Coeficiente de Similaridade de Cossenos Medida de sobreposio de vocabulrio amplamente utilizada, baseada em um modelo de espao vetorial. Cross-document Coreference Establishing whether two referring expressions, each possibly from a different information source, should be linked together or not. Correferncia em Mltiplos Documentos Determinar se duas expresses referenciais, cada uma possivelmente vinda de uma fonte de informao diferente, devem ser relacionadas ou no. Cross-document Fusion Elimination, aggregation, and generalization operations carried out across collection-wide information rather than document-specific information. Fuso de Mltiplos Documentos Operaes de eliminao, agregao e generalizao realizadas em informaes presentes em colees, ao invs de informaes especficas de um documento. Dice Coefficient A vocabulary overlap measure. Coeficiente de Dice Medida de sobreposio de vocabulrio. Differences (across documents) Can involve different information sources, different times of the reports, different points of view involving alternate interpretations of events, differences in the information available at the time of the report, or differences involving unrelated information. Informational equivalence (when not accompanied by semantic equivalence) and informational subsumption may also be viewed as indicators of differences. Diferenas (entre documentos) Podem envolver fontes de informao diferentes, tempos diferentes dos relatrios, pontos de vista diferentes que implicam interpretaes alternativas de eventos, diferenas nas informaes disponveis no momento do relatrio, ou diferenas que envolvem informaes no relacionadas. A equivalncia informativa (quando no acompanhada de equivalncia semntica) e a subsuno informativa tambm podem ser vistas como indicadores de diferenas. Filter Step Filter the matched elements, selecting salient ones based on some salience criterion. Etapa de Filtragem Filtrar os elementos emparelhados, selecionando os mais salientes com base em algum critrio de salincia. Generic MDS Algorithm An abstract, high-level characterization of the five steps taken by a MDS system: the Identify Step, the Match Step, the Filter Step, the Reduce Step, and the Present Step. Algoritmo Genrico para SAM Uma caracterizao abstrata, de alto nvel, dos cinco passos realizados por um sistema de SAM: Etapa de Identificao, Etapa de Emparelhamento, Etapa de Filtragem, Etapa de Reduo e Etapa de Apresentao. Goal of MDS To take an information source that is a collection of related documents and extract content from it, while removing redundancy and taking into account similarities and differences in information content, and present the most important content to the user in a condensed form and in a manner sensitive to the users or application's needs. Objetivo da SAM Pegar uma fonte de informao que seja uma coleo de documentos relacionados e extrair dela um contedo, removendo as redundncias e levando em considerao as semelhanas e diferenas no contedo das informaes, e apresentar o contedo mais importante ao usurio de uma forma condensada e sensvel s necessidades do usurio ou da aplicao. Identify Step Identify text elements to be extracted from the collection. Etapa de Identificao Identificar os elementos a serem extrados da coleo. Inclusion Coefficient An asymmetric vocabulary overlap measure, perhaps relevant for testing informational subsumption. Coeficiente de Incluso Uma medida assimtrica de sobreposio de vocabulrio, talvez relevante para testar a subsuno informativa. Informational Equivalence When a pair of text elements is judged by humans to contain the same information. Informationally equivalent elements can also be treated as redundant and eliminated. Equivalncia Informativa Quando um par de elementos de texto avaliado por humanos e conclui-se que eles contm as mesmas informaes. Elementos informativamente equivalentes podem ser tratados como redundantes e eliminados. Informational Subsumption Text element A informationally subsumes text element B if the information in element B is contained in element A. Here element A has additional information beyond information in element B. Subsuno Informativa Um elemento de texto A subsume informativamente um elemento de texto B se as informaes no elemento B estiverem contidas no elemento A. Aqui, o elemento A contm informaes adicionais alm das informaes no elemento B. Jaccard Coefficient A vocabulary overlap measure. Coeficiente de Jaccard Medida de sobreposio de vocabulrio. Latent Semantic Analysis A method to derive semantic similarities between terms based on their occurrences in common contexts. Anlise da Semntica Latente Mtodo para derivar as semelhanas semnticas entre termos com base em suas ocorrncias em contextos comuns. Match Step Match instances of Identified elements across documents, using an appropriate matching metric based on notions of string-identity, informational equivalence, or informational subsumption. Etapa de Emparelhamento Combinar instncias dos elementos identificados entre os documentos, utilizando uma mtrica de emparelhamento adequada baseada em noes de identidade de cadeias, equivalncia informativa ou subsuno informativa. Maximal Marginal Relevance (MMR) A method for reducing redundancy that uses a ranking parameter that allows a user to slide between relevance to query and diversity from hits seen so far. Relevncia Marginal Mxima (RMM) Mtodo para reduzir redundncias que utiliza um parmetro de classificao que permite ao usurio alternar continuamente entre a relevncia para a consulta e a diversidade de correspondncias obtidas na busca (hits) observadas at ento. MDS Multi-Document Summarization. SAM Sumarizao Automtica Multidocumento. Merging Operator Takes a pair of templates, each representing a different document, and merges them yielding a more salient merged template, which can be combined with other operators. A type of Aggregation operation. Operador de Fuso Toma um par de modelos (templates), cada um representando um documento diferente, e combina-os, gerando um modelo mesclado mais saliente, que pode ser combinado com outros operadores. Um tipo de operao de Agregao. Paraphrases Any semantically equivalent text elements are paraphrases of one another; the interesting case is where the pair of text elements is not string identical. Parfrases Quaisquer elementos de texto semanticamente equivalentes so parfrases um do outro; o caso interessante quando o par de elementos de texto no tm cadeias idnticas. Paraphrasing Rule Rules to decide if a phrase or sentence can be transformed into another which is usually informationally equivalent. Such rules bridge between active versus passive forms, ordering of syntactic components in the sentence, classifier vs. appositive expressions, e.g., Regra de Parafraseamento Regras para decidir se um sintagma ou sentena pode ser transformado em outro que normalmente informativamente equivalente. Estas regras permitem a transio entre as formas ativa e passiva, ordenao dos componentes sintticos das sentenas, Pentagon Speaker and speaker from the Pentagon, realization of the predicate in a main clause versus a relative clause, nominalization patterns, etc. expresses classificadoras vs. apositivas, por exemplo, Pentagon Speaker e speaker from the Pentagon, realizao do predicado em orao principal ou subordinada, padres de nominalizao, etc. Parse Tree Comparison Comparing two parse trees to see if one tree (or subtrees of it) can be transformed into (subtrees of) the other using paraphrasing rules. Comparao de rvores de Anlise Comparao de duas rvores de anlise para verificar se uma rvore (ou subrvores dela) pode ser transformada na outra (ou em subrvores desta) utilizando regras de parafraseamento. Present Step Present the resulting elements using generation and/or visualization methods. Etapa de Apresentao Apresentar os elementos resultantes utilizando mtodos de gerao e/ou visualizao. Reduce Step Reduce the matched elements using aggregation and generalization operations to come up with more succinct elements. Etapa de Reduo Reduzir os elementos emparelhados usando operaes de agregao e generalizao para chegar a elementos mais sucintos. Redundancy (across documents) Removing similar information recycled or repeated across different information sources. Redundncia (entre documentos) Remoo de informaes semelhantes recicladas ou repetidas em diferentes fontes de informao. Refinement Operator Merging Operator which addresses generalization/specialization differences in values of a common slot in two templates, each representing the semantic content of an article. Operador de Refinamento Operador de Fuso que trata de diferenas de generalizao/especializao nos valores de uma lacuna (slot) comum a dois modelos (templates), cada uma representando o contedo semntico de um artigo. Semantic Equivalence When a pair of text elements has exactly the same meaning. Equivalncia Semntica Quando um par de elementos de texto tem exatamente o mesmo significado. String Identity When a pair of text elements has exactly the same string. Identidade de Cadeias Quando um par de elementos de texto tem exatamente a mesma cadeia. Temporal Ordering Ordering information in summaries based on when the events described by the information occurred. Ordenao Temporal Ordenao das informaes em sumrios com base em quando ocorreram os eventos descritos nas informaes. Theme in MDS A cluster of informationally equivalent paragraphs, possibly drawn from multiple documents. Tema em SAM Um agrupamento de pargrafos informativamente equivalentes, possivelmente extrados de vrios documentos. Unique Terms Query-relevant terms unique to a document in a collection, as opposed to query-relevant terms common across documents. Can be used to identify query-relevant differences between documents, without being able to characterize the nature of the differences. Termos nicos Termos relevantes consulta presentes exclusivamente em um documento de uma coleo, em oposio a termos relevantes pesquisa comuns a vrios documentos. Podem ser usados para identificar diferenas relevantes consulta entre os documentos, sem ser capaz de caracterizar a natureza de tais diferenas. Vocabulary Overlap Measure A metric for comparing text segments for similarity based on common words or word-stems between them. Medida de sobreposio de vocabulrio Mtrica para comparao da similaridade de segmentos de texto com base em palavras ou razes de palavras comuns entre eles.
PORTUGUS INGLS Agrupamento Mtodo para reduzir uma coleo de documentos em subcolees de documentos relacionados. Clustering A method of reducing a collection of documents into sub-collections of related documents. Algoritmo Genrico para SAM Uma caracterizao abstrata, de alto nvel, dos cinco passos realizados por um sistema de SAM: Etapa de Identificao, Etapa de Emparelhamento, Etapa de Filtragem, Etapa de Reduo e Etapa de Apresentao. Generic MDS Algorithm An abstract, high-level characterization of the five steps taken by a MDS system: the Identify Step, the Match Step, the Filter Step, the Reduce Step, and the Present Step. Anlise da Semntica Latente Mtodo para derivar as semelhanas semnticas entre termos com base em suas ocorrncias em contextos comuns. Latent Semantic Analysis A method to derive semantic similarities between terms based on their occurrences in common contexts. Coeficiente de Dice Medida de sobreposio de vocabulrio. Dice Coefficient A vocabulary overlap measure. Coeficiente de Incluso Uma medida assimtrica de sobreposio de vocabulrio, talvez relevante para testar a subsuno informativa. Inclusion Coefficient An asymmetric vocabulary overlap measure, perhaps relevant for testing informational subsumption. Coeficiente de Jaccard Medida de sobreposio de vocabulrio. Jaccard Coefficient A vocabulary overlap measure. Coeficiente de Similaridade de Cossenos Medida de sobreposio de vocabulrio amplamente utilizada, baseada em um modelo de espao vetorial. Cosine Similarity Coefficient A very widely used vocabulary overlap measure, based on a vector space model. Comparao de rvores de Anlise Comparao de duas rvores de anlise para verificar se uma rvore (ou subrvores dela) pode ser transformada na outra (ou em subrvores desta) utilizando regras de parafraseamento. Parse Tree Comparison Comparing two parse trees to see if one tree (or subtrees of it) can be transformed into (subtrees of) the other using paraphrasing rules. Correferncia em Mltiplos Documentos Determinar se duas expresses referenciais, cada uma possivelmente vinda de uma fonte de informao diferente, devem ser relacionadas ou no. Cross-document Coreference Establishing whether two referring expressions, each possibly from a different information source, should be linked together or not. Diferenas (entre documentos) Podem envolver fontes de informao diferentes, tempos diferentes dos relatrios, pontos de vista diferentes que implicam interpretaes alternativas de eventos, diferenas nas informaes disponveis no momento do relatrio, ou diferenas que envolvem informaes no relacionadas. A equivalncia informativa (quando no acompanhada de equivalncia semntica) e a subsuno informativa tambm podem ser vistas como indicadores de diferenas. Differences (across documents)
Can involve different information sources, different times of the reports, different points of view involving alternate interpretations of events, differences in the information available at the time of the report, or differences involving unrelated information. Informational equivalence (when not accompanied by semantic equivalence) and informational subsumption may also be viewed as indicators of differences. Equivalncia Informativa Quando um par de elementos de texto avaliado por humanos e conclui-se que eles contm as mesmas informaes. Elementos informativamente equivalentes podem ser tratados como redundantes e eliminados. Informational Equivalence When a pair of text elements is judged by humans to contain the same information. Informationally equivalent elements can also be treated as redundant and eliminated. Equivalncia Semntica Quando um par de elementos de texto tem exatamente o mesmo significado. Semantic Equivalence When a pair of text elements has exactly the same meaning. Etapa de Apresentao Apresentar os elementos resultantes utilizando mtodos de gerao e/ou visualizao. Present Step Present the resulting elements using generation and/or visualization methods. Etapa de Emparelhamento Combinar instncias dos elementos identificados entre os documentos, utilizando uma mtrica de emparelhamento adequada baseada em noes de identidade de cadeias, equivalncia informativa ou subsuno informativa. Match Step Match instances of Identified elements across documents, using an appropriate matching metric based on notions of string-identity, informational equivalence, or informational subsumption. Etapa de Filtragem Filtrar os elementos emparelhados, selecionando os mais salientes com base em algum critrio de salincia. Filter Step Filter the matched elements, selecting salient ones based on some salience criterion. Etapa de Identificao Identificar os elementos a serem extrados da coleo. Identify Step Identify text elements to be extracted from the collection. Etapa de Reduo Reduzir os elementos emparelhados usando operaes de agregao e generalizao para chegar a elementos mais sucintos. Reduce Step Reduce the matched elements using aggregation and generalization operations to come up with more succinct elements. Fuso de Mltiplos Documentos Operaes de eliminao, agregao e generalizao realizadas em informaes presentes em colees, ao invs de informaes especficas de um documento. Cross-document Fusion Elimination, aggregation, and generalization operations carried out across collection-wide information rather than document-specific information. Identidade de Cadeias Quando um par de elementos de texto tem exatamente a mesma cadeia. String Identity When a pair of text elements has exactly the same string. Medida de sobreposio de vocabulrio Mtrica para comparao da similaridade de segmentos de texto com base em palavras ou razes de palavras comuns entre eles. Vocabulary Overlap Measure A metric for comparing text segments for similarity based on common words or word-stems between them. Objetivo da SAM Pegar uma fonte de informao que seja uma coleo de documentos relacionados e extrair dela um contedo, removendo as redundncias e levando em considerao as semelhanas e diferenas no contedo das informaes, e apresentar o contedo mais importante ao usurio de uma forma condensada e sensvel s necessidades do usurio ou da aplicao. Goal of MDS To take an information source that is a collection of related documents and extract content from it, while removing redundancy and taking into account similarities and differences in information content, and present the most important content to the user in a condensed form and in a manner sensitive to the users or application's needs. Operador de Contradio Operador de Fuso que trata diferenas de valores incompatveis de uma lacuna (slot) comum a dois modelos (templates), cada um representando o contedo semntico de um artigo. Contradiction Operator Merging Operator which addresses incompatible differences in values of a common slot in two templates, each representing the semantic content of an article. Operador de Fuso Toma um par de modelos (templates), cada um representando um documento diferente, e combina-os, gerando um modelo mesclado mais saliente, que pode ser combinado com outros operadores. Um tipo de operao de Agregao. Merging Operator Takes a pair of templates, each representing a different document, and merges them yielding a more salient merged template, which can be combined with other operators. A type of Aggregation operation. Operador de Refinamento Operador de Fuso que trata de diferenas de generalizao/especializao nos valores de uma lacuna (slot) comum a dois modelos (templates), cada uma representando o contedo semntico de um artigo. Refinement Operator Merging Operator which addresses generalization/specialization differences in values of a common slot in two templates, each representing the semantic content of an article. Ordenao Temporal Ordenao das informaes em sumrios com base em quando ocorreram os eventos descritos nas informaes. Temporal Ordering Ordering information in summaries based on when the events described by the information occurred. Parfrases Quaisquer elementos de texto semanticamente equivalentes so parfrases um do outro; o caso interessante quando o par de elementos de texto no tm cadeias idnticas. Paraphrases Any semantically equivalent text elements are paraphrases of one another; the interesting case is where the pair of text elements is not string identical. Redundncia (entre documentos) Remoo de informaes semelhantes recicladas ou repetidas em diferentes fontes de informao. Redundancy (across documents) Removing similar information recycled or repeated across different information sources. Regra de Parafraseamento Regras para decidir se um sintagma ou sentena pode ser transformado em outro que normalmente informativamente equivalente. Estas regras permitem a transio entre as formas ativa e passiva, ordenao dos componentes sintticos das sentenas, expresses classificadoras vs. apositivas, por exemplo, Pentagon Speaker e speaker from the Pentagon, realizao do predicado em orao principal ou subordinada, padres de nominalizao, etc. Paraphrasing Rule Rules to decide if a phrase or sentence can be transformed into another which is usually informationally equivalent. Such rules bridge between active versus passive forms, ordering of syntactic components in the sentence, classifier vs. appositive expressions, e.g., Pentagon Speaker and speaker from the Pentagon, realization of the predicate in a main clause versus a relative clause, nominalization patterns, etc. Relevncia Marginal Mxima (RMM) Mtodo para reduzir redundncias que utiliza um parmetro de classificao que permite ao usurio alternar continuamente entre a relevncia para a consulta e a diversidade de correspondncias obtidas na busca (hits) observadas at ento. Maximal Marginal Relevance (MMR) A method for reducing redundancy that uses a ranking parameter that allows a user to slide between relevance to query and diversity from hits seen so far. SAM Sumarizao Automtica Multidocumento. MDS Multi-Document Summarization. Subsuno Informativa Um elemento de texto A subsume informativamente um elemento de texto B se as informaes no elemento B estiverem contidas no elemento A. Aqui, o elemento A contm informaes adicionais alm das informaes no elemento B. Informational Subsumption Text element A informationally subsumes text element B if the information in element B is contained in element A. Here element A has additional information beyond information in element B. Tema em SAM Um agrupamento de pargrafos informativamente equivalentes, possivelmente extrados de vrios documentos. Theme in MDS A cluster of informationally equivalent paragraphs, possibly drawn from multiple documents. Termos nicos Termos relevantes consulta presentes exclusivamente em um documento de uma coleo, em oposio a termos relevantes pesquisa comuns a vrios documentos. Podem ser usados para identificar diferenas relevantes consulta entre os documentos, sem ser capaz de caracterizar a natureza de tais diferenas. Unique Terms Query-relevant terms unique to a document in a collection, as opposed to query-relevant terms common across documents. Can be used to identify query-relevant differences between documents, without being able to characterize the nature of the differences.