Kaggle Wettbewerb: wann sind Fragen identisch?

Ich spiele jetzt mit einem neuen Kaggle Wettbewerb. Es geht darum, zwei Fragen, die  auf Quora gestellt wurden, mit einander zu vergleichen und dann zu entscheiden, ob es hier um die gleiche Frage geht.

Das ist spannend, es geht nicht nur um Zahlen sondern auch um die Verarbeitung von Sprache. Als Mr. Selfmademan arbeite ich mich jetzt durch Foren, Webseiten und dem Buch ‚Text Analytics with Python‚ und kriege ein vage Idee, wie ich das Problem lösen könnte. Die Idee ist so vage, dass ich noch keine Lösung eingestellt habe. (Auch ist mein Rechner nicht auf diese Datenmengen gebaut.)

Advertisements

3 Trackbacks

  1. By Meilenstein « — was einer so denkt — on 29 März 2017 at 7:38 am

    […] « Kaggle Wettbewerb: wann sind Fragen identisch? […]

  2. […] Damit war ich heute noch nicht so erfolgreich. Ich hänge auf eine User Defined Function, wobei ich die Fehlermeldung in der Console kenne – ich arbeite wieder mit den Kaggle Quora Daten. […]

  3. […] Ich versuche gerade ein interessantes Problem zu lösen. Hier und hier habe ich beschrieben, wie ich den Performance von Spark und Pandas vergleichen will auf die Daten vom Kaggle Quora Wettbewerb. […]

Einen Kommentar schreiben

Required fields are marked *

*
*

%d Bloggern gefällt das: