Beschreibung
Die Merkmalskonstruktion, auch Feature Engineering genannt, ist ein entscheidender Arbeitsschritt bei der Datenaufbereitung für das maschinelle Lernen, der die Leistung der Modelle stark beeinflusst. In diesem praxisnahen Buch lernen Sie Techniken, um Merkmale numerische Repräsentationen eines bestimmten Aspekts von Rohdaten zu gewinnen und mit maschinellen Lernmodellen nutzbar zu machen. Jedes Kapitel führt Sie durch eine spezifische Aufgabe der Datenanalyse wie etwa die Darstellung von Text- oder Bilddaten. Diese Beispiele veranschaulichen die wichtigsten Prinzipien der Merkmalskonstruktion.Statt diese Prinzipien nur zu beschreiben, legen die Autorinnen Alice Zheng und Amanda Casari im gesamten Buch den Schwerpunkt auf die praktische Anwendung mit Übungen. Das Schlusskapitel vertieft das Gelernte, indem es verschiedene Techniken der Merkmalskonstruktion auf einen realen, strukturierten Datensatz anwendet. In den Beispielen werden Python-Pakete wie numpy, Pandas, scikit-learn und Matplotlib verwendet.Aus dem Inhalt:- Merkmalskonstruktion an numerischen Daten: Filter, Klasseneinteilung, Skalierung, logarithmische und Potenz-Transformationen- Techniken für natürlichen Text: Bag-of-Words-Modelle, n-Gramme und Phrasenerkennung- Frequenzfilterung und Merkmalsskalierung zum Entfernen aussageloser Merkmale- Kodierungstechniken für Kategorievariablen, darunter Merkmals-Hashing und Klassenzählung- Modellgesteuerte Merkmalskonstruktion mit der Hauptkomponentenanalyse- Das Konzept der Modellkombination mit dem k-Means-Algorithmus als Technik zur Merkmalserzeugung- Gewinnung von Bildmerkmalen anhand manueller und Deep-Learning-Techniken
Autorenportrait
Alice Zheng ist technische Leiterin für angewandtes Machine Learning und beschäftigt sich mit Algorithmen und Plattformentwicklung. Derzeit ist sie Forschungsmanagerin bei Amazon Advertisement. Zuvor war sie bei GraphLab/Dato/Turi mit der Werkzeugentwicklung und der Weiterbildung von Anwendern betraut und forschte über maschinelles Lernen bei Microsoft Research. Sie besitzt einen Doktortitel für Elektrotechnik und Informatik sowie einen Bachelor-Abschluss in Informatik und Mathematik von der University of California, Berkeley.Amanda Casari ist eine führende Ingenieurin, die technisches Neuland erkundet und danach fragt, wie man die Auswirkungen dieser Neuerungen am besten aufzeigen kann. Sie ist derzeit leitende Produktmanagerin und Datenanalytikerin bei Concur Labs und Mitbegründerin der KI-Forschungsgruppe von Concur Labs bei SAP Concur. Über die letzten 16 Jahre arbeitete sie in einer Vielzahl funktionsübergreifender Rollen und technischer Fachgebiete, darunter Datenanalyse, maschinelles Lernen, komplexe Systeme und Robotik. Amanda besitzt einen Abschluss als Bachelor of Science in Steuersystemtechnik von der United States Naval Academy und als Master of Science in Elektrotechnik von der University of Vermont.
Inhalt
rkmalskonstruktion, auch Feature Engineering genannt, ist ein entscheidender Arbeitsschritt bei der Datenaufbereitung fur das maschinelle Lernen, der die Leistung der Modelle stark beeinflusst. In diesem praxisnahen Buch lernen Sie Techniken, um Merkmale - numerische Reprasentationen eines bestimmten Aspekts von Rohdaten - zu gewinnen und mit maschinellen Lernmodellen nutzbar zu machen. Jedes Kapitel fuhrt Sie durch eine spezifische Aufgabe der Datenanalyse wie etwa die Darstellung von Text- oder Bilddaten. Diese Beispiele veranschaulichen die wichtigsten Prinzipien der Merkmalskonstruktion. Statt diese Prinzipien nur zu beschreiben, legen die Autorinnen Alice Zheng und Amanda Casari im gesamten Buch den Schwerpunkt auf die praktische Anwendung mit bungen. Das Schlusskapitel vertieft das Gelernte, indem es verschiedene Techniken der Merkmalskonstruktion auf einen realen, strukturierten Datensatz anwendet. In den Beispielen werden Python-Pakete wie numpy, Pandas, scikit-learn und Matplotlib verwendet. Aus dem Inhalt:- Merkmalskonstruktion an numerischen Daten: Filter, Klasseneinteilung, Skalierung, logarithmische und Potenz-Transformationen- Techniken fr natrlichen Text: Bag-of-Words-Modelle, n-Gramme und Phrasenerkennung- Frequenzfilterung und Merkmalsskalierung zum Entfernen aussageloser Merkmale- Kodierungstechniken fr Kategorievariablen, darunter Merkmals-Hashing und Klassenzhlung- Modellgesteuerte Merkmalskonstruktion mit der Hauptkomponentenanalyse- Das Konzept der Modellkombination mit dem k-Means-Algorithmus als Technik zur Merkmalserzeugung- Gewinnung von Bildmerkmalen anhand manueller und Deep-Learning-Techniken
Informationen zu E-Books
„E-Book“ steht für digitales Buch. Um diese Art von Büchern lesen zu können wird entweder eine spezielle Software für Computer, Tablets und Smartphones oder ein E-Book Reader benötigt. Da viele verschiedene Formate (Dateien) für E-Books existieren, gilt es dabei, einiges zu beachten.
Von uns werden digitale Bücher in drei Formaten ausgeliefert. Die Formate sind EPUB mit DRM (Digital Rights Management), EPUB ohne DRM und PDF. Bei den Formaten PDF und EPUB ohne DRM müssen Sie lediglich prüfen, ob Ihr E-Book Reader kompatibel ist. Wenn ein Format mit DRM genutzt wird, besteht zusätzlich die Notwendigkeit, dass Sie einen kostenlosen Adobe® Digital Editions Account besitzen. Wenn Sie ein E-Book, das Adobe® Digital Editions benötigt herunterladen, erhalten Sie eine ASCM-Datei, die zu Digital Editions hinzugefügt und mit Ihrem Account verknüpft werden muss. Einige E-Book Reader (zum Beispiel PocketBook Touch) unterstützen auch das direkte Eingeben der Login-Daten des Adobe Accounts – somit können diese ASCM-Dateien direkt auf das betreffende Gerät kopiert werden.
Da E-Books nur für eine begrenzte Zeit – in der Regel 6 Monate – herunterladbar sind, sollten Sie stets eine Sicherheitskopie auf einem Dauerspeicher (Festplatte, USB-Stick oder CD) vorsehen. Auch ist die Menge der Downloads auf maximal 5 begrenzt.