Dans Tes Stats

Envoyé par Sycareus 
Re: Dans Tes Stats mardi 3 janvier 2017 04:50:29
Magnifique ! Splendide ! Une belle initiative que, je pense, nous ne pouvons que féliciter ! Félicitations :)

Sinon j'ai une question/remarque : dans les quotes les plus longues, c'est normal qu'il n'y ai pas celle avec le mec qui raconte sa journée avec une fille et son amie "kidnappée" (qui voulait arnaquer son "amie" avec intervention de la police ? Je pensais qu'elle était tout de même assez longue pour être dans le top :/

Sinon, encore bravo :)
Re: Dans Tes Stats mardi 3 janvier 2017 05:06:24
J'ajoute un second bravo, et de gros soupirs sur la façon dont tu as d'occuper ton temps libre.
Re: Dans Tes Stats mardi 3 janvier 2017 08:25:48
Tes réserves d'alcool sont vides ?
Re: Dans Tes Stats mardi 3 janvier 2017 09:13:11
Tu as fait ça en une seule soirée Oo ? T'as automatisé le truc rassure moi ?
Re: Dans Tes Stats mardi 3 janvier 2017 09:48:57
Bravo Syca <3
Re: Dans Tes Stats mardi 3 janvier 2017 10:08:08
Hahahahahaha :)
Par contre.
Sous Word ?
T'as rippé sur ton clavier ?
Tu t'es vraiment fait une base de donnée sous Word ?

Non allez avoues que t'as pompé le site et que tu l'as injecté bien proprement dans une base NoSQL pour t'entrainer.
remouk Administrateur
Re: Dans Tes Stats mardi 3 janvier 2017 10:32:12
J'espère pour lui parce que sinon il suffisait de demander, c'est l'affaire de quelques requêtes pas plus. :D

@Syca: Maintenant que c'est fait, je peux partager ton résultat sur le blog de DTC ? Comme un petit bilan de fin d'année 2016 c'est sympa.
Re: Dans Tes Stats mardi 3 janvier 2017 13:02:50
Demande de la thune Syca, demande.
Re: Dans Tes Stats mardi 3 janvier 2017 16:26:29
Je viens de "retrouver" la quote dont je parlais, il s'agit de la #16541, mais maintenant renvoie sur une erreur 404 ou quote introuvable quand on la cherche soit en url, soit dans la recherche intégrée au site. Un cher Admin a sans doute dû la supprimer :(
Re: Dans Tes Stats mardi 3 janvier 2017 16:38:55
Si tu as besoin d'une oreille attentive Syca, je suis dispo. En plus j'ai une toute nouvelle cargaison d'oreilles attentives, de toutes les couleurs et de toutes les tailles !
Re: Dans Tes Stats mardi 3 janvier 2017 17:54:27
@Roger : NoSQL, toujours NoSQL.. Les bonnes vieilles formes normales, ça a du bon aussi. Postgres, en l'occurrence.

@LPA : une petite heure le 30 pour écrire le crawler, un week-end pour se remettre du réveillon, une autre heure hier pour écrire les requêtes.

@remouk : Ouais, bien sûr, vas-y.
18300 requêtes pour être précis, avec un petit timeout pour pas surcharger le serveur.

Tant que j'ai la base, si quelqu'un a des questions existentielles à se poser, balancez vos requêtes.

Merci Lester, j'y va rosir de ce pas.
Re: Dans Tes Stats mercredi 4 janvier 2017 07:42:37
Et bah gg :p
Re: Dans Tes Stats mercredi 4 janvier 2017 09:57:19
Ah, et une idée de stat : Les plus verbeux. On compte la moyenne de caractères par message des gens.
Re: Dans Tes Stats mercredi 4 janvier 2017 10:05:27
Tu peux tenter le plus lyrique, en cherchant les posts avec les mots les plus longs. J'ai peur que ce soit un truc de merde du genre "aaaaaaaaaaaaaaaaaaaaaaaaaaaaaah" qui gagne, mais ce serait marrant de trouver des trucs bien écrits avec des mots de plus de 3 lettres. Tu peux mettre un filtre et ignorer tout ce qui est plus long que anticonstitutionnellement pour éviter les mecs qui s'endorment sur leur clavier.
Re: Dans Tes Stats mercredi 4 janvier 2017 12:51:55
Tu peux le nombre de quote de Ben et Magus ?
Re: Dans Tes Stats mercredi 4 janvier 2017 17:54:48
Bek : 38, dont une avec le pseudo 'magus' en minuscules, plus une autre qui parle de Magus sans qu'il soit présent.

Pour les deux du dessus, ça peut se faire mais il me faudrait la regex de 'moukmouk pour parser les pseudos.
Re: Dans Tes Stats mercredi 4 janvier 2017 19:33:12
Elle doit parser les pseudos où ?
Re: Dans Tes Stats mercredi 4 janvier 2017 20:35:20
Re: Dans Tes Stats mercredi 4 janvier 2017 23:03:37
Les quotes sont composées d'un seul bloc de texte.

Si on veut faire n'importe quoi qui nécessite de se focaliser sur les pseudos, connaître le nombre de quotes par pseudo, ou simplement parser chaque message individuellement, on en a besoin comme délimiteur.

Pour répondre à Bek sur Ben et Magus, j'ai just fait un SELECT sur le ts_vector("magus") (merci Postgres), mais ce n'est pas généralisable, ni applicable sur des pseudos plus communs qui peuvent apparaître dans le corps du message (d'ailleurs, une des quotes parle de Magus mais il n'y intervient pas)

J'aurais pu (du) repérer les pseudos avec un quelconque markup au moment du parsing des pages du site (ils sont dans un span spécial), mais je ne l'ai pas fait, et il faudrait tout crawl à nouveau.
(Yes, I'm fun at parties.)
Re: Dans Tes Stats jeudi 5 janvier 2017 00:05:17
Tu viens quand me rendre visite?
Re: Dans Tes Stats jeudi 5 janvier 2017 10:10:20
Et les commentaires ?


Sinon, pour les pseudos, tu cherche en début de ligne, et tu t'arrête quand tu trouve un "dit", un ":" ou un ">". Ça devrai couvrir la majorité des cas. Si on note d'autres cas y'a moyen d'être exhaustif.
Ou tu refais un coup de crawler :p
Re: Dans Tes Stats jeudi 5 janvier 2017 14:52:43
Citation
LPA_
Et les commentaires ?


Sinon, pour les pseudos, tu cherche en début de ligne, et tu t'arrête quand tu trouve un "dit", un ":" ou un ">". Ça devrai couvrir la majorité des cas. Si on note d'autres cas y'a moyen d'être exhaustif.
Ou tu refais un coup de crawler :p
T'es officiellement la meuf la plus drôle du forum.
Re: Dans Tes Stats jeudi 5 janvier 2017 16:09:42
Es tu sur que je suis une femme =D ?

Pour la première partie avec une regex ça ce fait bien.
Seuls les utilisateurs enregistrés peuvent poster des messages dans ce forum. Se connecter / s'inscrire.