photo credit: natalielucier
Il est possible pour un humain de tout savoir sur un sujet, sous réserve de prendre un sujet suffisament concis. Par exemple, tout savoir sur un groupe de rock ou tout savoir sur les équations quadratiques.
Par contre il est impossible pour un humain de savoir tout ce qui existe. L’exhaustivité n’est jamais assurée, sauf être une machine.
C’est ce qu’on l’on croyait jusqu’il y a peu de temps. Cependant avec la vitesse de développement d’Internet, ce n’est plus possible non plus.
Google n’a pas la capacité d’indexer tout Internet en temps réel. D’ailleurs Google n’a pas la capacité d’indexer TOUT Internet.
Chaque seconde, des milliers de pages sont créées et des millions sont modifiées. Google dépend maintenant de Twitter pour ce qui est en temps réel.
Il est fort probable que la partie immergée d’Internet, la partie invisible des moteurs ne fasse qu’augmenter avec le temps. La longue traîne est un concept sans avenir.
S’il y a trop d’activité au dessus de la ligne d’horizon, personne ne regarde ce qui se passe en dessous.
J’ai du mal à comprendre pourquoi la longue traine serait un concept sans avenir sous prétexte que rien ni personne ne peut tout connaître/indexer ??
A partir du moment où des gens font des requêtes il y aura toujours un effet de longue traine à mon sens, le temps réel ne s’applique pas à tout et tout le monde ne cherche pas des choses génériques.
En même temps entre le temps où l’information sort et son indexation…l’information a été tweeté , retweeté, rebalancé sur les digg-likes, etc …Difficile d’indexer le tout en temps réel.
Si je ne m’abuse, il y a plus de 5 ans (c’est long sur Internet) j’avais entendu parler du Deep Web… Alors quoi ? Big Google ne donne pas accès à tout ? C’est vrai que c’est surprenant, mais c’est bon de le savoir : ça aide à prendre du recul et remettre les choses en perspectives.
Par contre, tout comme Nico j’ai du mal à voir le rapport avec la supposée absence d’avenir de la long tail…
@Dushan et @Nico: si la totalité des contenus n’est pas indexé, il y a de forte probabilité que certains contenus longues traines ne le soient pas.
@ Maxime :
> « @Dushan et @Nico: si la totalité des contenus n’est pas indexé, il y a de forte probabilité que certains contenus longues traines ne le soient pas. »
Mais y a-t-il à ton avis une raison spécifique pour que cette probabilité soit plus grande pour les contenus long tail que pour n’importe quel autre type de contenu ? Le contraire ne serait-il pas plus logique ? Un contenu long tail est sans doute plus rare qu’un contenu ciblant un mot-clé générique, il y a donc moins de chance qu’il se « perde dans le tas », non ?
Amicalement,
Dushan
@ Dushan, le problème c’est que Google est opaque et qu’il est tres difficile de le cerner.
Je pense que le maître mot est « intérêt » . Reste à savoir si c’est celui de GG ou de l’internaute
Aujourd’hui les moteurs de recherche sont désormais obligés de payer pour indexer twitter … des gros sites de news de presse commencent à se demander si ils ne vont pas tout simplement retirer leur accès à google pour pouvoir faire payer des abonnements au public. Demain qui sait si ce type d’action ne risque pas d’augmenter…google et autres seraient obligés de payer pour indexer ! Le monde à l’envers 🙂
Nicolas
Excellent article !! Tres bon boulot !! buzz people