this post was submitted on 17 May 2024
22 points (100.0% liked)

Forum Libre

730 readers
30 users here now

Communautés principales de l'instance

Nous rejoindre sur Matrix: https://matrix.to/#/#jlai.lu:matrix.org

Une communauté pour discuter de tout et de rien:

Les mots d'ordre sont : respect et bienveillance.

Les discussions politiques sont déconseillées, et ont davantage leur place sur

Les règles de l'instance sont bien entendu d'application.

Fils hebdomadaires"

"Demandez-moi n'importe quoi"

Communautés détendues

Communautés liées:

Loisirs:

Vie Pratique:

Communautés d'actualité

Société:

Pays:

Communauté de secours:

founded 1 year ago
MODERATORS
 

Post original par @nathalie__013@lemmy.world

top 25 comments
sorted by: hot top controversial new old
[–] bionicjoey@lemmy.ca 11 points 6 months ago (2 children)

Il y a plusieurs années que OpenAI a déjà consommé tout les contenus publiques de Reddit sans leur permission. Les GPT 2 et 1 ont été utilisé sur les subreddits "subredditsimulator"

[–] Ziggurat@sh.itjust.works 4 points 6 months ago (1 children)

C'est donc comme ça que ça marchait ? Et d'ailleurs le bot qui fait les auto TL/DR, c'est aussi basé sur un GPT ?

[–] bionicjoey@lemmy.ca 5 points 6 months ago* (last edited 6 months ago)

Je crois que le TLDR bot original n'utilisait pas GPT. Il simplement identifiait les phrases dans l'article qui etaient les plus "importants" (qui est décidé par quelque algorithme)

[–] pseudo@jlai.lu 4 points 6 months ago

Oui, mais maintenant OpenAi qu'elle a entraîné son modèle sur des données obtenues par consentement.

[–] gilarelli@jlai.lu 11 points 6 months ago (2 children)
[–] anansi@jlai.lu 6 points 6 months ago (1 children)

On rappelle surtout que c'est uniquement vrai dans le modèle d'une entreprise capitaliste motivée par la recherche de profit.

Dans n'importe quel autre modèle, associatif, bénévole, ou autre, ce n'est pas le cas.

[–] gilarelli@jlai.lu 1 points 6 months ago

Tu as surement raison dans l'absolu, mais je suis un vieux désabusé qui pense que si tu laisses entrevoir une opportunité de profit à la plus belle des causes, tu as de grandes chances de corrompre l'idée originale à cause du facteur humain.

Mais c'est vrai aussi que ce n'est pas forcément systématique.

[–] Krakaval@jlai.lu 4 points 6 months ago (2 children)

On paie combien pour Lemmy, mastodon,… en tant qu’utilisateur… ?

[–] pseudo@jlai.lu 4 points 6 months ago

Perso de mon temps. J'essaye de faire plus de publication que ce à quoi pousse mon caractère parce que j'ai vraiment envie de voir cette communauté se développer et mes données perso aussi parce que j'ai jamais autant raconté ma vie dans tous le reste d'internet.

[–] Camus@lemmy.blahaj.zone 4 points 6 months ago (1 children)

@anansi@jlai.lu paie le serveur. Tout le monde paie avec son temps pour maintenir les communautés actives

Je n'ai jamais trop aimé l'argument du "gratuit = produit", ça ne marche pas pour les projets bénévoles.

[–] gilarelli@jlai.lu 1 points 6 months ago (1 children)

Effectivement, ça s'adresse aux outils grand public cette affirmation. Ça reste quand même une niche les projets opensource comme Lemmy.

Mais même là, rien n'empêche anansi de revendre un jour les données jlai.lu - sauf peut être la licence d'utilisation de Lemmy ? Je ne dit pas qu'il le ferai, soyons bien clair ! Mais n'importe qui pourrait monter une instance dans ce but.

[–] Camus@lemmy.blahaj.zone 1 points 6 months ago (1 children)

Il faut distinguer deux choses:

Si anansi décide de vendre jlai.lu, donc le nom de domaine, le site et tout ce qu'il contient, actuellement, c'est son droit. Après, vu la facilité de connecter les communautés sur Lemmy, dans le scénario hypothétique où si ça devait arriver, quelqu'un lancerait sans doute une autre instance francophone, et les communautés s'organiseraient pour y migrer. Et de toute façon, comme tu le dis, n'importe qui pourrait déjà créer une instance dans le but de récupérer les données, pas besoin de racheter jlailu pour ça.

Par rapport à Lemmy en tant que logiciel, la licence oblige le code à rester libre effectivement.

[–] gilarelli@jlai.lu 1 points 6 months ago (1 children)

Je vais arrêter de prendre anansi/jlai.lu comme exemple parce qu'on va finir par penser que j'ai un biais contre lui alors que ce n'est vraiment pas le cas ; c'était plus un exemple concret parce que directement impliqué.

Je ne parlais pas forcément de la revente du site et du nom de domaine, mais seulement des données utilisateurs (exactement ce qu'est en train de faire reddit en fait) - et c'est, soit dit en passant, la raison principale qui me fait bondir quand je vois des posts qui sont contre la défédération de threads : si méta se greffe au fédiverse ce n'est pas pour la beauté de la technologie, faut être miro pour pas voir ce qu'ils ont à y gagner !

[–] Racine@lemmy.nuage-libre.fr 2 points 6 months ago

Ce serait vraiment bête d'acheter les données d'une instance lemmy parce que la plupart des données sont publiques et accessibles par tous avec un navigateur et la quasi-totalité des données est accessible aux autres instances fédérées.

À la limite, ce qui pourrait être intéressant à acheter, c'est les logs des heures de connexion, les messages privés et les adresses mails.

Il ne faut pas oublier que ces données peuvent aussi être volées en cas d'erreur de configuration (même si pour une petite instance, je ne vois pas l'intérêt de les cibler).

Quant à la propriété intellectuelle des commentaires, (si le contenu peut être protégé par le droit de la propriété intellectuelle), pour la vendre, il faudrait faire accepter des conditions d'utilisation qui la cède à l'instance.

[–] keepthepace 10 points 6 months ago* (last edited 6 months ago) (1 children)

Le but n'est pas pour OpenAI d'accéder à ces données qu'ils ont déjà aspiré, c'est de rendre impossible la même chose par des groupes open source en prétendant que c'est illégal de le faire sans verser quelques millions à reddit.

[–] Krakaval@jlai.lu 3 points 6 months ago (1 children)

Si c’est illégal pour les groupes open source, est-ce légal pour Google et autres moteurs de recherche d’aspirer les contenus et de les indexer ?

[–] keepthepace 4 points 6 months ago

Le truc c'est que les groupes open source ne peuvent pas cacher qu'ils le font, Google, Meta, OpenAI, si.

[–] pseudo@jlai.lu 6 points 6 months ago
[–] Professeur_Falken@jlai.lu 4 points 6 months ago

Ça y est, la boite de Pandorre est ouverte.

[–] Krakaval@jlai.lu 3 points 6 months ago (2 children)

Il y avait un JavaScript à mettre en favoris qui permettait d’éditer tous les messages de son compte. Il faudrait que je retrouve ça …

[–] just_chill@jlai.lu 1 points 6 months ago (2 children)

On rappelle que certains textes, comme des articles de presse, ont interdit leur usage par l'IA. Il ne faut surtout pas recopier ces textes là dans ses messages reddit, ca serait illégal 🙃

[–] Krakaval@jlai.lu 3 points 6 months ago

La même presse qui utilise l’IA à tour de bras pour rédiger du contenu…

[–] Camus@lemmy.blahaj.zone 2 points 6 months ago (1 children)

Après, est-ce qu'on recopiant ses textes, on ne devient pas receleur? Je ne suis pas un expert en droit, mais ça peut être dangereux si on veut le faire systématiquement pour essayer que les IA soient poursuivies, on risque de se faire poursuivre dans la foulée 😅

[–] just_chill@jlai.lu 2 points 6 months ago* (last edited 6 months ago)

c'est pas faux. On pourrait aussi tout remplacer par du lorem ipsum, ce serait moins dangereux.