• ComplexLotus@lemmy.world
    link
    fedilink
    Deutsch
    arrow-up
    2
    ·
    edit-2
    1 year ago

    Sofern ich das Verstanden habe, hat das Unternehmen “OPEN-AI” chatgpt auch teilweise mit reddit Kommentaren trainiert. Dies illustriert, dass die (Text-) Daten die Reddit (nun hinter verschlossenen Toren) angehäuft hat, auch in Zukunft wertvoll sein werden, um:

    • Antworten auf obskure Fragen zu finden, die nur vor Jahren auf reddit gestellt wurden
    • obskure Interessen zu bedienen
    • Allgemeine Abbildung der Sprachgeschichte, Geschichte der politischen Meinung (besonders in den USA, woher ja die meisten reddit-User stammen)

    Auch ein deutsches Sprach-Modell der Humboldt Universität -Berlin wurde basierend auf deutschen reddit Kommentaren trainiert, was zeigt, das reddit Kommentare auch eine wertvolle Quelle für deutschen Text geworden ist smh.