Beschreibung
While Web 2.0 was about data, Web 3.0 is about knowledge and information.Scripting Intelligence: Web 3.0 Information Gathering and Processing offers the reader Ruby scripts for intelligent information management in a Web 3.0 environmentincluding information extraction from text, using Semantic Web technologies, information gathering (relational database metadata, web scraping, Wikipedia, Freebase), combining information from multiple sources, and strategies for publishing processed information. This book will be a valuable tool for anyone needing to gather, process, and publish web or database information across the modern web environment.
Text processing recipes, including speech tagging and automatic summarizationGathering, visualizing, and publishing information from the Semantic WebInformation gathering from traditional sources such as relational databases and web sites
Autorenportrait
Mark Watson is the author of 14 books on artificial intelligence, Java, C++, UML, and Linux. He is a consultant who uses Ruby, Java, and Common Lisp. He maintains a web site at markwatson.com.
Inhalt
Text Processing.- Parsing Common Document Types.- Cleaning, Segmenting, and Spell-Checking Text.- Natural Language Processing.- The Sematic Web.- Using RDF and RDFS Data Formats.- Delving Into RDF Data Stores.- Performing SPARQL Queries and Understanding Reasoning.- Implementing SPARQL Endpoint Web Portals.- Information Gathering and Storage.- Working with Relational Databases.- Supporting Indexing and Search.- Using Web Scraping to Create Semantic Relations.- Taking Advantage of Linked Data.- Implementing Strategies for Large-Scale Data Storage.- Information Publishing.- Creating Web Mashups.- Performing Large-Scale Data Processing.- Building Information Web Portals.
Informationen zu E-Books
„E-Book“ steht für digitales Buch. Um diese Art von Büchern lesen zu können wird entweder eine spezielle Software für Computer, Tablets und Smartphones oder ein E-Book Reader benötigt. Da viele verschiedene Formate (Dateien) für E-Books existieren, gilt es dabei, einiges zu beachten.
Von uns werden digitale Bücher in drei Formaten ausgeliefert. Die Formate sind EPUB mit DRM (Digital Rights Management), EPUB ohne DRM und PDF. Bei den Formaten PDF und EPUB ohne DRM müssen Sie lediglich prüfen, ob Ihr E-Book Reader kompatibel ist. Wenn ein Format mit DRM genutzt wird, besteht zusätzlich die Notwendigkeit, dass Sie einen kostenlosen Adobe® Digital Editions Account besitzen. Wenn Sie ein E-Book, das Adobe® Digital Editions benötigt herunterladen, erhalten Sie eine ASCM-Datei, die zu Digital Editions hinzugefügt und mit Ihrem Account verknüpft werden muss. Einige E-Book Reader (zum Beispiel PocketBook Touch) unterstützen auch das direkte Eingeben der Login-Daten des Adobe Accounts – somit können diese ASCM-Dateien direkt auf das betreffende Gerät kopiert werden.
Da E-Books nur für eine begrenzte Zeit – in der Regel 6 Monate – herunterladbar sind, sollten Sie stets eine Sicherheitskopie auf einem Dauerspeicher (Festplatte, USB-Stick oder CD) vorsehen. Auch ist die Menge der Downloads auf maximal 5 begrenzt.