Proceedings of the 19th Nordic Conference of Computational Linguistics (NODALIDA 2013)

Linköping Electronic Conference Proceedings; Volume 85 (ISSN 1650-3740)

(Published by Linköping University Electronic Press; 581 83 Linköping; Sweden; ISBN 978-91-7519-589-6)

Front Matter

Table of Contents

Stephan Oepen, Janne Bondi Johannessen
Preface

Invited Keynotes

Ron Kaplan
The Conversational User Interface

Caroline Sporleder
Detecting and Processing Figurative Language in Discourse

Anders Søgaard
6,909 Reasons to Mess Up Your Data

Special Session on HPC for NLP

Gudmund Høst
The Nordic e-Infrastucture Collaboration: Opportunities for Synergy Across Borders

Stephan Oepen
Tidying up the Basement: A Tale of Large-Scale Parsing on National eInfrastructure

Jörg Tiedemann
Experiences in Building the Let's MT! Portal on Amazon EC2

Regular Papers

Eckhard Bick
Using Constraint Grammar for Chunking

Johan Falkenjack, Katarina Heimann Mühlenbock, Arne Jönsson
Features Indicating Readability in Swedish Text

Katri Haverinen, Veronika Laippala, Samuel Kohonen, Anna Missilä, Jenna Nyblom, Stina Ojala, Timo Viljanen, Tapio Salakoski, Filip Ginter
Towards a Dependency-Based PropBank of General Finnish

Ryan Johnson, Lene Antonsen, Trond Trosterud
Using Finite State Transducers for Making Efficient Reading Comprehension Dictionaries

Jurgita Kapočiūtė-Dzikienė, Anders Nøklestad, Janne Bondi Johannessen, Algis Krupavičius
Exploring Features for Named Entity Recognition in Lithuanian Text Corpus

Hrafn Loftsson
Tagging the Past: Experiments using the Saga Corpus

Hrafn Loftsson, Robert Östling
Tagging a Morphologically Complex Language Using an Averaged Perceptron Tagger: The Case of Icelandic

Magnus Merkel, Jody Foo, Lars Ahrenberg
IPhraxtor: A Linguistically Informed System for Extraction of Term Candidates

Costanza Navarretta, Patrizia Paggio
Classifying Multimodal Turn Management in Danish Dyadic First Encounters

Bolette S. Pedersen, Lars Borin, Markus Forsberg, Neeme Kahusk, Krister Lindén, Jyrki Niemi, Niklas Nisbeth, Lars Nygaard, Heili Orav, Eirikur Rögnvaldsson, Mitchell Seaton, Kadri Vider, Kaarlo Voionmaa
Nordic and Baltic Wordnets Aligned and Compared through ``WordTies''

Eva Pettersson, Beáta Megyesi, Joakim Nivre
Normalisation of Historical Text Using Context-Sensitive Weighted Levenshtein Distance and Compound Splitting

Teemu Ruokolainen, Miikka Silfverberg
Modeling OOV Words With Letter N-Grams in Statistical Taggers: Preliminary Work in Biomedical Entity Recognition

Inguna Skadiņa, Andrejs Vasiļjevs, Lars Borin, Krister Lindén, Gyri Losnegaard, Sussi Olsen, Bolette S. Pedersen, Roberts Rozis, Koenraad De Smedt
Baltic and Nordic Parts of the European Linguistic Infrastructure

Student Papers

Liesbeth Augustinus, Peter Dirix
The IPP Effect in Afrikaans: A Corpus Analysis

Christopher Horn, Alisa Zhila, Alexander Gelbukh, Roman Kern, Elisabeth Lex
Using Factual Density to Measure Informativeness of Web Documents

Tapio Luostarinen, Oskar Kohonen
Using Topic Models in Content-Based News Recommender Systems

Bernd Opitz, Cäcilia Zirn
Bootstrapping an Unsupervised Approach for Classifying Agreement and Disagreement

Pēteris Paikens, Laura Rituma, Lauma Pretkalniņa
Morphological Analysis with Limited Resources: Latvian Example

Lauma Pretkalniņa, Laura Rituma
Statistical Syntactic Parsing for Latvian

Short Papers

Filip Ginter, Jenna Nyblom, Veronika Laippala, Samuel Kohonen, Katri Haverinen, Simo Vihjanen, Tapio Salakoski
Building a Large Automatically Parsed Corpus of Finnish

Lars Hellan, Tore Bruland
Constructing a Multilingual Database of Verb Valence

Jussi Karlgren
New Measures to Investigate Term Typology by Distributional Data

Andreas Søeborg Kirkedal
Analysis of Phonetic Transcription for Danish Automatic Speech Recognition

Samuel Läubli, Mark Fishel, Martin Volk, Manuela Weibel
Combining Statistical Machine Translation and Translation Memories with Domain Adaptation

Sjur N. Moshagen, Tommi A. Pirinen, Trond Trosterud
Building an Open-Source Development Infrastructure for Language Technology Projects

Gailius Raškinis, Asta Kazlauskienė
From Speech Corpus to Intonation Corpus: Clustering Phrase Pitch Contours of Lithuanian

Jonathon Read, Rebecca Dridan, Stephan Oepen
Simple and Accountable Segmentation of Marked-up Text

Sara Stymne, Jörg Tiedemann, Christian Hardmeier, Joakim Nivre
Statistical Machine Translation with Readability Constraints

Hideyuki Tanushi, Hercules Dalianis, Martin Duneld, Maria Kvist, Maria Skeppstedt, Sumithra Velupillai
Negation Scope Delimitation in Clinical Text Using Three Approaches: NegEx, PyConTextNLP and SynNeg

Marcus Uneson
Tone Restoration in Transcribed Kammu: Decision-List Word Sense Disambiguation for an Unwritten Language

Nynke Van Der Vliet, Gosse Bouma, Gisela Redeker
The Automatic Identification of Discourse Units in Dutch Text

Demonstration Papers

Liesbeth Augustinus, Vincent Vandeghinste, Ineke Schuurman, Frank Van Eynde
Example-Based Treebank Querying with GrETEL - Now Also for Spoken Dutch

Malin Ahlberg, Lars Borin, Markus Forsberg, Martin Hammarstedt, Leif-Jöran Olsson, Olof Olsson, Johan Roxendal, Jonatan Uppström
Korp and Karp – A Bestiary of Language Resources: The Research Infrastructure of Språkbanken

Lars Hellan, Tore Bruland, Elias Aamot, Mads H. Sandøy
A Grammar Sparrer for Norwegian

Mans Hulden, Miikka Silfverberg, Jerid Francom
Finite State Applications with Javascript

Emanuele Lapponi, Erik Velldal, Nikolay A. Vazov, Stephan Oepen
HPC-ready Language Analysis for Human Beings

Paul Meurer, Helge Dyvik, Victoria Rosén, Koenraad De Smedt, Gunn Inger Lyse, Gyri Smørdal Losnegaard, Martha Thunes
The INESS Treebanking Infrastructure

Per Erik Solberg
Building Gold-Standard Treebanks for Norwegian