Category Archives: Steunenberg Data Science

Kaggle 3: die harte Gangart

Nachdem ich einiges ausprobiert hab im Titanic Wettbewerb, versuch ich jetzt, in einem anderen Wettbewerb nach vorne zu kommen. Dabei stolpere ich jetzt knallhart über die Realität. In diesem Wettbewerb gibt es sowohl numerische Daten als auch Text. Sklearn hat ein wunderbares Konzept um Daten auseinander zu ziehen und nachher wieder zusammenzufügen, sehr wiederverwendbar und […]

Kaggle 2: climbing the ranks

Ich spiele erst mal in dem einfachsten Kaggle-Wettbewerb rum, die Aufgabe mit den Fischen ist für diese Woche zu hoch gegriffen. Ausgehende von der Lösung, die im DataCamp Kaggle Tutorial entwickelt werden, klettere ich jetzt mit einer SVM Lösung die Rangliste hoch. Mal sehen, was die Neuronale Netze bringen. Nach wie vor bräuchte ich ein reales […]

Kaggle

Ich habe jetzt Kaggle entdeckt. Nachdem ich keinen Respons bekommen habe auf meinen Aufruf für ein Projekt, und März naht, werde ich mir da eine Spielwiese aussuchen. Erst werde ich mal zu hoch greifen und versuchen, mir diesem Wettbewerb anzuschließen. Das scheint mir ein sehr sinnvolles Projekt. Ich habe nur gar keine Ahnung von Bilderkennung […]

Fertig! (mit DataCamp Python Curriculum)

Ich bin durch mit dem DataCamp Python Curriculum. Zeit für Real Life Erfahrungen. Bald ist auch März, und das war die Planung für März. (Was fehlt ist Textmining.)

Wilde Einsichten beim Maschinenlernen lernen

Das sind noch mal Einsichten. Ich habe gerade eine Übung aus der Python-Maschinelles Lernen Kurs von DataCamp gemacht. In der Übung wird der Zusammenhang zwischen Aktienpreise von unterschiedene Firmen visualisiert. Computerfirmen liegen nah beieinander, Fluchtzeugbauer, Colahersteller, Ölfirmen, alles logisch. Aber warum correlieren Tabaksfirmen und Pharmafirmen so fein? Kann es sein, dass das, was gut für […]

Ich brauch ein Projekt

Ich brauche dringendst ein Project, um meine neuen Erkenntnisse um zu setzen. Gerne im not-for-profit Bereich. Im nächsten Monat wäre ich 2 Tage pro Woche verfügbar. Wer also einen Hinweis hat, möge mir den geben, mein Dank wird groß sein. Im Moment sauge ich Wissen auf und die DataCamp Kurse sind auch praxisnah, aber ich […]

DataCamp pandas Kurs ist schwierig.

Ich habe jetzt den DataCamp Einführungskurs in pandas durchgearbeitet. Das war nicht einfach. Der Kurs ist dicht bepackt mit Informationen, die Aufgaben sind nicht so ausgearbeitet als die Aufgaben in den bisherigen Kursen. Das ist manchmal nervig, aber es hat mich auch gezwungen, mich intensiv mit dem Thema auseinander zu setzen. Und wie passend, dass das […]

DataCamp Data Import

Ich habe gerade der Zweite der Datacamp ‚Data Import mit Python‘ Kurse zu Ende gebracht. Ein Riesenrundumschlag aber oberflächlich. OK, in kurzer Zeit spielen mit dem Import von Textdateien Exceldateien SAS- und Statadaeien Matlabdateien HDF5-Dateien (noch nie von gehört) Daten aus SQL Datenbanken (das SQLAlchemy package kannte ich noch nicht) Lesen von Webseiten Benutzen der […]

Neuronale Netze revisited

Da muss ich schon wieder was zurücknehmen: so schlimm sind neuronale Netze nicht, wenn man sie besser parametrisiert. Shame on me. Hier das Ergebnis in einer zweiten Runde, das sieht ziemlich gut aus!

Neuronale Netze und sklearn

Ha! Mein erster kleiner Erfolg mit sklearn. Ich habe den Code aus dem sklearn Tutorial von Datacamp um einen Test mit neuronalen Netzen ergänzt. Und das hat funktioniert. Insofern, dass es deutlich ist, dass die Support Vector Machines besser geeignet sind. Hier ist das Ergebnis für die neuronalen Netze: Das Ergebnis für die SVM sieht […]