Beschreibung
Digitale Korpora haben die Voraussetzungen, unter denen sich Wissenschaftler mit der Erforschung von Sprachphänomenen beschäftigen, fundamental verändert. Umfangreiche Sammlungen geschriebener und gesprochener Sprache bilden mittlerweile die empirische Basis für mathematisch präzise Generalisierungen über zu beschreibende Wirklichkeitsausschnitte. Das Datenmaterial ist hochkomplex und besteht neben den Rohtexten aus diversen linguistischen Annotationsebenen sowie außersprachlichen Metadaten. Als unmittelbare Folge stellt sich die Konzeption adäquater Recherchelösungen als beträchtliche Herausforderung dar. Im vorliegenden Buch wird deshalb ein datenbankbasierter Ansatz vorgestellt, der sich der Problematiken multidimensionaler Korpusrecherchen annimmt. Ausgehend von einer Charakterisierung der Anforderungsmerkmale linguistisch motivierter Suchen werden Speicherungs- und Abfragestrategien für mehrfach annotierte Korpora entwickelt und anhand eines linguistischen Anforderungskatalogs evaluiert. Ein Schwerpunkt liegt dabei in der Einführung problemorientierter Segmentierung und Parallelisierung.
Autorenportrait
PD Dr. Roman Schneider leitet den Programmbereichs "Sprachtechnologie und Informationssysteme" am Institut für Deutsche Sprache (IDS) in Mannheim. Daneben engagiert er sich kontinuierlich in der akademischen Lehre, u.A. an den Universitäten Gießen, Leipzig, Mannheim, Trier und Augsburg.
Inhalt
1Einführung und Motivation
2Linguistische Anforderungen an Sprachkorpora
2.1Natürlichsprachliche Korpora in der Sprachwissenschaft
2.2Deutschsprachige Korpora im internationalen Kontext
2.3Recherche in ausgewählten Korpussammlungen
2.4Multidimensionale Suchkriterien
2.5Anforderungskatalog für linguistisch motivierte Korpusabfragen
3Design und Implementierung eines Korpusabfragesystems
3.1Spektrum der Speicherungsmodelle
3.2Ein Referenzsystem für die relationale Korpusspeicherung
3.3Evaluierung einzelner Designentscheidungen
4Evaluation des Anforderungskatalogs
4.1Abfrage 1: Einfaches Suchmuster
4.2Abfrage 2: Suffixsuche mit Platzhalterzeichen
4.3Abfrage 3: Komplexes Relativsatz-Muster
4.4Abfrage 4: ACI-Konstruktionen
4.5Abfrage 5: W-Fragen ohne Verb
4.6Abfrage 6: Movierung in virtuellen Subkorpora
4.7Abfrage 7: Genitivobjekte
4.8Abfrage 8: Partizipialphrase vor niederfrequentem Nomen
4.9Abfrage 9: Regulärer Ausdruck mit Rechts-Trunkierung
4.10Abfrage 10: Regulärer Ausdruck mit Links-Trunkierung
4.11Einflussfaktoren auf die Abfrage-Laufzeiten
5Versuch einer Laufzeitoptimierung durch segmentierte Abfragen
5.1Parallelisierung als Chance für das Korpusretrieval
5.2Problemorientierte Algorithmisierung
5.3Evaluation des alternativen Suchalgorithmus
6Integration in ein Online-Framework
6.1Suchformulare
6.2Speicherung von Beleglisten
6.3Schnittstellen zu Statistikwerkzeugen
6.4Übersichtslisten
7Zusammenfassung und Fazit
Literaturverzeichnis
Informationen zu E-Books
„E-Book“ steht für digitales Buch. Um diese Art von Büchern lesen zu können wird entweder eine spezielle Software für Computer, Tablets und Smartphones oder ein E-Book Reader benötigt. Da viele verschiedene Formate (Dateien) für E-Books existieren, gilt es dabei, einiges zu beachten.
Von uns werden digitale Bücher in drei Formaten ausgeliefert. Die Formate sind EPUB mit DRM (Digital Rights Management), EPUB ohne DRM und PDF. Bei den Formaten PDF und EPUB ohne DRM müssen Sie lediglich prüfen, ob Ihr E-Book Reader kompatibel ist. Wenn ein Format mit DRM genutzt wird, besteht zusätzlich die Notwendigkeit, dass Sie einen kostenlosen Adobe® Digital Editions Account besitzen. Wenn Sie ein E-Book, das Adobe® Digital Editions benötigt herunterladen, erhalten Sie eine ASCM-Datei, die zu Digital Editions hinzugefügt und mit Ihrem Account verknüpft werden muss. Einige E-Book Reader (zum Beispiel PocketBook Touch) unterstützen auch das direkte Eingeben der Login-Daten des Adobe Accounts – somit können diese ASCM-Dateien direkt auf das betreffende Gerät kopiert werden.
Da E-Books nur für eine begrenzte Zeit – in der Regel 6 Monate – herunterladbar sind, sollten Sie stets eine Sicherheitskopie auf einem Dauerspeicher (Festplatte, USB-Stick oder CD) vorsehen. Auch ist die Menge der Downloads auf maximal 5 begrenzt.