Wie wird man Data Scientist?

    9
    47



    Data Science, was ist das überhaupt? Was macht ein Data Scientist? Was muss man lernen, wenn man eine Data Science Karriere anstrebt? Diese Fragen beantworte ich im heutigen Video.

    Dem Beruf des Data Scientists wurde schon 2009 von Hal Varian und einige Jahre später dem Harvard Business Review eine glorreiche Zukunft vorhergesagt. Diese Vorhersage ist eingetreten, Daten spielen eine wichtigere Rolle denn je, und Data Scientists sind auf dem Arbeitsmarkt extrem gefragt.

    Data Science ist allerdings ein recht allgemeiner Begriff (“Wissenschaft mit Daten”), der sich in viele Unterbereiche aufgliedern lässt, zum Beispiel: Messung & Metriken, Strategie, Vorhersagen (Time Series Analysis), Korrelationen, Experimente (AB-Tests), Data Engineering (Logging, ETL-Pipelines), Modellierung, Optimierung, Visualisierung, Maschinelles Lernen, Künstliche Intelligenz.

    Hinzu kommt, dass man sich mit jedem dieser Bereiche auf einer von drei Stufen beschäftigen kann:
    1) Grundlagenforschung (Level: Professor)
    2) Angewandte Forschung bzw. Core Data Science (Level: PhD)
    3) Anwendung bzw. Product Data Science (Level: Bachelor/Master/PhD)

    Um als typischer Data Scientist in einer Firma zu arbeiten, sollte man mathematische Vorkenntnisse haben. Bewerber kommen üblicherweise aus Feldern wie: Informatik, Physik, Mathematik, Wirtschaftswissenschaften, Maschinenbau, Psychologie, …

    Vor allem die Statistik spielt in fast allen Bereichen eine immense Rolle. Darüber hinaus ist ein guter Data Scientist mit Python und/oder R bewandert und hat gute Kommunikationsfähigkeiten.

    Peter Wang (Gründer Anaconda) beantwortet die Frage “Was ist Data Science” so: data science is a literacy, not a job. Ihm zufolge entwickelt sich Data Science mehr und mehr zu einer allgemein notwendigen Fähigkeit, die keinem einzelnen Berufszweig zuzuordnen ist.

    Wenn du anfangen möchtest, dich mit Data Science zu beschäftigen, sind Bücher, Videos oder Vorlesungen zu Statistik und Python eine gute Wahl. Für eine umfangende Einführung empfehle ich Onlinekurse, z.B. den genannten von Coursera, siehe Link weiter unten.

    ▬ Über diesen Kanal ▬▬▬▬▬▬▬▬▬▬▬▬

    Ich habe Informatik und Mathematik in Hamburg, Cambridge und Paris studiert und arbeite derzeit als Software Engineer bei Facebook in London. Auf diesem Kanal erzähle ich von meinen Erfahrungen und gebe Tipps rund um Studium und Karriere, vor allem im Informatikbereich. Jetzt kostenlos abonnieren: https://bit.ly/Niklas_Abo

    ▬ Mehr Videos ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬

    Hier erfährst du, wo man Praktika findet, die aufwärts von 4000 Euro monatlich zahlen:
    ►https://youtu.be/FZgjmFDPdPs

    So sieht ein typischer Arbeitsalltag für mich aus:
    ► https://youtu.be/YaakNj9ap0U

    Die wichtigsten Inhalte im Informatikstudium:
    ► https://youtu.be/O-DKi2Ju7s0

    ▬ Mein Equipment ▬▬▬▬▬▬▬▬▬▬▬▬▬

    Tastatur:
    ►https://amzn.to/3dSHllc
    Maus:
    ►https://amzn.to/31IglQq
    Kamera:
    ►https://amzn.to/34us32Z
    Mikrofon:
    ►https://amzn.to/3oAf48f
    Audio-Recorder:
    ►https://amzn.to/34usElf
    Beleuchtung:
    ►https://amzn.to/2HrC8oY

    Unterstütze kostenlos meinen Kanal, indem du über diese Links bei Amazon bestellst!

    ▬ Lass uns Freunde sein! ▬▬▬▬▬▬▬▬▬▬

    ►Instagram: https://bit.ly/Niklas_IG (neu!)
    ►Facebook: https://bit.ly/Niklas_FB
    ►XING: https://bit.ly/Niklas_XING
    ►LinkedIn: https://bit.ly/Niklas_LinkedIn

    ▬ Links zu diesem Video ▬▬▬▬▬▬▬▬▬▬

    David McCandless: The beauty of data visualization
    ► https://youtu.be/5Zg-C8AAIGg

    Data Science Track auf Coursera
    ► https://www.coursera.org/specializations/jhu-data-science

    ▬ Timestamps ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬

    0:00 – Intro
    0:17 – Sexiest Job of the 21st Century
    1:03 – Was ist Data Science?
    1:20 – Messung & Strategie
    2:03 – Vorhersagen
    2:18 – Korrelationen
    3:04 – Experimente (mit Übungsaufgabe)
    4:40 – Data Engineering
    5:22 – Modellierung & Optimierung
    5:48 – Visualisierung
    6:22 – Künstliche Intelligenz
    6:45 – Wie wird man Data Scientist?
    7:04 – Forschung
    7:27 – Core Data Science
    8:12 – Product Data Science
    8:48 – Was muss man lernen?
    10:28 – Data Science als allgemeine Fähigkeit
    11:46 – Wo sollte man anfangen?
    13:52 – YouTube Data Science
    14:15 – Instagram

    ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬

    Quelle für das Bild von Hal Varian: https://commons.wikimedia.org/wiki/File:Hal_Varian.jpg

    source

    Previous articleBEM UI: Kami Malu Rektorat UI Undang Luhut, Kami Tidak Percaya Big Data Pemilu Versi Luhut
    Next articleCreating lambda function using cloudformation stack

    47 COMMENTS

    1. Mein take für die Frage: Da die Nutzung des neuen ad managers eine Wahl war und nicht random ist es möglich das nur die die sowieso bessere ads machen auf den neuen umsteigen und die die wenig Arbeit reinstecken auch lieber nicht gewechselt haben. In diesem fall ist nur weil die Leute die den neuen haben bessere Ergebnisse haben nicht klar ob die Ergebnisse das Resultat des managers sind oder die Manager Auswahl ein Resultat der Ergebnisse.

    2. New Ads Manager: Es besteht nicht zwingend ein Zusammenhang zwischen dem neuen Produkt und den dem Erfolg der Anzeigen. Es gibt natürlich ein paar grundlegende Fehler, wie z.B. den Messzeitraum zu kurz wählen. Dann währen die guten Ergebnisse vielleicht Saisonal.

      Ein weiterer Punkt sein, dass rein hypothetisch, die Nutzer die das neue Produkt schnell annehmen generell bessere Anzeigen schaltet. Hat also nix mit dem Produkt sondern dem Nutzereigenschaften zu tun.

      Falls jmd Kritik hat an meiner Analyse, bitte mitteilen 🙂 danke

    3. Frage: Data Science ist ja eher naturwissenschaftlich, trotzdem scheinen sich auch einige wirtschaftliche Aspekte dahinter zu befinden (gerade durch die Stochastik). Kann mir jemand genauer erklären was man an Wirtschaftlichem alles lernt, wenn man Data Science studiert?

    4. Zur Aufgabe:
      Wir müssten die Ergebnisse zunächst um andere Variablen korrigieren:
      – Zufällige Abweichung in der Stichprobe: Beworbene Produkt/Dienstleistung. Evtl. haben wir in der Gruppe des neuen Ad Managers attraktivere Produkte.
      – Was bringt Unternehmen überhaupt dazu den neuen bzw. den alten zu verwenden und hat/haben diese Variable(n) vielleicht Auswirkungen auf die Kampagnenperfomance?

    5. Wäre es möglich mal auf ML & AI einzugehen? Vielleicht auch mal kurz angeschnitten in Bezug auf die Robotik ( autonomes fahren, Mensch & Maschinen Interaktion usw)

      Ich selbst interessiere mich für die Robotik, genauer gesagt für Hardware programmieren und das programmieren von einer künstlichen Intelligenz. Weiß aber selbst nicht in welchem Beruf man beide Komponente abdecken würde will mich Ungerne auf eines der Bereiche fixieren 🤔

    6. Ich würde sagen weil der Zusammenhang wenig Sinn ergibt. Nur weil neue Kunden mit neuen und aktuelleren Geschäftsideen bessere Resultate erzielen heißt es nicht das die Software besser ist. Eventuell sind es lediglich deren Geschäftsmodelle.

    7. auf 4:37 – Early Adopters, d.h. Leute, die alles Neue gerne ausprobieren, sind oft kreativer und risikobereiter als die Gruppe, die sich mit Müh und Not in etwas einarbeitet, und es dann für immer so benutzt wie sie es gelernt haben.
      Also sind die Erfolge beider Gruppen nicht wirklich vergleichbar, weil es sich von Vornherein um unterschiedliche Gruppen handelte.
      Was man vergleichen könnte, wäre der vorher und nachher Erfolg beider Gruppen.

    8. Hallo Niklas, ich studiere aktuell Mathematik in Teilzeit. Beruflich hat sich bei mir einiges getan und ich will mich auf Data Science fokussieren also überlege ich den Studiengang zu wechseln. Allerdings geht das nur in Teilzeit (Fernstudium) an einer privaten Uni. Wie ist deine Einschätzung bzgl Chancen auf dem Arbeitsmarkt mit dieser Variante?

    9. Sehr gutes Video! 🙂
      Habe B. Eng. Medizintechnik studiert und da Daten v. A. in der Forschung (Stichwort: personalisierte Medizin) sehr wichtig sind, will ich mich jetzt eher in den Bereich "umorientieren".
      Statistik u. Mathe würde ich sagen, bin ich ganz gut bewandert. In der Programmierung war ich größtenteils eher Hobbymäßig unterwegs (kleine Projekte, z. B. Vokabeltrainer mit JAVA), hatten das allerdings auch recht viel im Studium…war sogar mehrere Semester Tutor :D.

      In letzter Zeit sehe ich hierzu immer Werbung auf IG oder in Apps (momentan viel auf Jobsuche) für Kurse, welche von der Agentur f. Arbeit 100% übernommen werden (kostentechnisch). Hast du da Erfahrungen gemacht / gehört mit solchen Kursen? Oder denkst du es wäre bessser sich auf eine Trainee-Stelle zu bewerben?

      PS: Wer zu viele "s" findet, kann sie behalten, die Taste ist schon lädiert :D.

    10. Super informatives und sachlich gegliedertes Video!
      Respekt.
      Cool Mal die Sicht von jemanden zu haben der Experte in dem Thema ist.

      Ich bin noch in der neunten Klasse aber hab den größten Wunsch auch Mal Data Scientist zu werden.
      Gibt's da schon Sachen die ich vorher tun kann um mich am besten auf die Sachen vorzubereiten oder ist es noch zu früh?

    11. Hi ich mache derzeit eine Ausbildung zum Fachinformatiker – Anwendungsentwicklung. Ich denke derzeit über ein duales Studium nach. Denkst du dass das Studium gut investierte Zeit, ist oder sollte ich "einfach" durch gezielte Jobsuche in den Bereich kommen?

    12. Hey Niklas, super Video!

      Meine Frage ist: Wie sieht das ohne Studium aus?
      Größtes Manko wird natürlich der fehlende Nachweis von Statistik-Wissen sein.

      Zum Hintergrund: Ich habe eine Bankausbildung und dann nur zur Hälfte Wirtschaftsinformatik studiert. Aus privaten Gründen habe ich das Studium jedoch zumindest pausiert.
      Statistik Klausur hatte ich nicht abgelegt.

      Es gibt ja zum Teil Bootcamps (ähnlich wie beim Programmieren) für Data Science. Und natürlich haufenweise Online-Kurse usw.

      Was ist deine Meinung dazu? Gibt es dann kleine Chancen?
      Wenn die Statistik-Kenntnisse nachgeholt werden 🙂 Bestimmt gibt es auch hier Wege Zertifkate usw. zu erlangen.

      VG
      Marius

    13. 4:34 : Naja die Tatsache alleine, dass die Leute mit der neuen SW bessere Ergebnisse erzielen muss nicht ausschließlich an der neuen SW liegen, sondern generell am Umstand dass die SW neu ist und deswegen überhaupt von den Usern mit größerer Bereitschaft genutzt wird. Die User beschäftigen sich einfach mehr damit, als sie es bei der alten getan hätten.

    14. Die Unterteilung in Kontrollgruppe und Treatment Gruppe ist nicht randomisiert, sondern hängt von der Wahl der Individuen in der Population ab. Es ist z.B. denkbar, dass in der Gruppe N mit der neueren Version ein größerer Anteil an Individuen ist, welches an state-of-the-art Technologie interessiert und allgemein leistungsstärker ist.

    15. Die Argumentation aus dem Beispiel war falsch, weil man die WAHL hatte die neue Software auszuprobieren oder nicht. Daher denke ich, dass eher kunden diese neue software ausprobiert haben, die schon erfolgreich/ gut gelaufen sind. Daher mit der neuen Variante genau so gute Ergebnisse erzielen. LG und kp ob der ansatz stimmt xD

    16. Video angehalten: Kommentar folgt:
      Ich glaube das die Argumentation nicht sinnvoll ist da man nicht zu 100% bestimmen kann ob durch diese oder jene Änderung ein Produkt besser oder schlechter "ankommt". Denn das "Anfangsprodukt" kann durchaus verschieden sein. Der Mensch, das Unternehmen das ganz andere Strategien fährt etc.
      Hoffe das es "richtig" ist 🙂

    17. Super Video :)) Dass Data Science heutzutage eine Grundkenntnis ist kann ich nur beistimmen! Data Science öffnet so viele Türen! Als Data Science Anfänger würde ich auf jeden Fall mit Python anfangen! Auch wenn Data Science nichts für dich ist, Python ist sehr flexibel und definitiv der Mühen wert! :)) Ihr könnt auch gerne bei unseren Datamics Onlinekursen reinschnuppern! Lohnt sich auf jeden Fall! Also dann, frohes Lernen ihr alle! :))