Salut! Identification

Recherche avancée

Comment calculer le Top 50 de DTC

Envoyé par remouk 
Ce forum est en lecture seule. C'est une situation temporaire. Réessayez plus tard.
Comment calculer le Top 50 de DTC
mercredi 18 octobre 2017 13:49:18
Depuis la première version du site, il y a un Top 50 des meilleures publications. Pour que ça se renouvelle, le top est basé sur un calcul pondéré par différentes choses, comme l'ancienneté, etc.

Avec la nouvelle version du site et des applis, on a maintenant un Top semaine et un Top mois, en plus du Top 50. Donc plus besoin de renouveler ; par contre "score = (votes plus) - (votes moins)" favoriserait beaucoup trop les anciennes quotes / les plus vues, et je ne veux pas que les plus anciennes soit indétrônables.

J'ai quelques pistes de mon côté, dont une qui me semble être la bonne, mais avant de l'implémenter, je vous demande votre avis ! :)

Comment feriez-vous ?
Re: Comment calculer le Top 50 de DTC
mercredi 18 octobre 2017 13:56:36
Tu pourrais calculer un ration de + / - plutôt que de bêtement faire la soustraction ?
genre nbPlus / nbVoteTotal ?
ou alors tu peux aussi prendre en compte le nombre de vues dans le calcul, comme un truc avec le ratio de votes par vues et le ratio de votes positifs... Je sais pas si prendre en compte le ratio votes / vues est pertinent ici, par contre
Re: Comment calculer le Top 50 de DTC
mercredi 18 octobre 2017 14:03:37
Peut être un truc du style
(upvote - downvote)*(upvote/[downvote+1])
Re: Comment calculer le Top 50 de DTC
mercredi 18 octobre 2017 14:34:14
Ouep, un ratio est dans tous les cas plus astucieux et plus représentatif qu'une soustraction.
Par curiosité, je me suis renseigné sur la façon dont Youtube choisissait ses "top commentaires" sous une vidéo, pour voir si on pouvait trouver un parallèle.
Un mec sur un thread a semble-t-il trouvé une formule empiriquement.

Tout n'est pas applicable à DTC évidemment.
Ce qui peut l'être, et qui fait rentrer une donnée de plus dans l'équation, reviendrait à prendre en compte le nombre de commentaires sous la quote, en assimilant qu'une quote très populaire et appréciée amène davantage de coms qu'une quote moyenne.
D'après le lien que j'ai donné, la formule utilisée par Youtube serait le ratio upvotes sur downvotes multiplié par 10, auquel on ajoute le nombre de commentaires multiplié par 2.
Ex : Une quote avec 100 upvotes, 20 downvotes et 15 réponses aurait un score de (100/20) x 10 + 15 x 2 = 80.
A éventuellement considérer et ajuster...

L'ancienneté est toujours à prendre en compte pour assurer une bonne rotation je suppose. Je sais pas quelle pondération tu utilises, mais je suppose qu'elle sera toujours d'actualité.
Re: Comment calculer le Top 50 de DTC
mercredi 18 octobre 2017 15:12:24
La différence entre votes positifs et votes négatifs, comme vous l'avez dit privilegiera les anciennes quotes/ celles qui ont le plus de visibilité.
Le ratio sera problématique pour les quotes ayant trop peu de votes.
L'approche probabiliste, consistant à estimer un intervalle de confiance pour une proportion, semble être une méthode donnant des résultats acceptables. Un peu de lecture.

Modifié 1 fois. Dernière modification le 18/10/17 15:16 par Dr.MV.
Re: Comment calculer le Top 50 de DTC
mercredi 18 octobre 2017 15:24:31
Lecture intéressante, je connaissais pas cette méthode de calcul !

Pour le ratio, un premier ordre d'approximation (moins raffiné donc) consisterait assez simplement à mettre en place une borne inférieure (i.e. un nombre minimal de votes) à partir de laquelle les quotes sont éligibles pour entrer dans le Top 50.

Ultra-basique, et loin d'être parfait, mais très simple à mettre en place et ça permet d'éviter l'exemple d'Amazon illustré par ton article (qui est super chiant en pratique en effet).
Re: Comment calculer le Top 50 de DTC
mercredi 18 octobre 2017 18:51:19
Citation
Dr.MV
La différence entre votes positifs et votes négatifs, comme vous l'avez dit privilegiera les anciennes quotes/ celles qui ont le plus de visibilité.
Le ratio sera problématique pour les quotes ayant trop peu de votes.
L'approche probabiliste, consistant à estimer un intervalle de confiance pour une proportion, semble être une méthode donnant des résultats acceptables. Un peu de lecture.

Excellente idée.

Question : niveau données, tu as quoi, en plus des infos affichées ? Le nombre de vues d'une quote ? Le nombre de votes 'uniques' (i.e. re-voter après raffraîchissement de l'IP/du timeout) ?
Re: Comment calculer le Top 50 de DTC
vendredi 27 octobre 2017 09:37:34
Merci pour vos réponses, ça me confirme dans la piste que je pensais suivre. ;) Très bonne lecture Dr.MV !