[CHASSEURS DE MOTEURS] - Numéro 20 ============================================================ c H A S S E U R s . d e . m O T E U R s Bulletin des spécialistes des outils de recherche NUMERO VINGT LE 29 NOVEMBRE 2000 ============================================================ SOMMAIRE o Editorial o Brèves o Courrier de chasse o Les outils de recherche spécialisés . ADX . Galileo . WAP on the Net . Comment ça marche o Les outils de recherche régionaux, la Franche-Comté . Est Infos . La Franche-Comté . H@ute-S@one o Interview de Pauline Tourneur, responsable de la documentation de Nomade.fr o Internet et sardines à l'huile . Initiation à la recherche sur le Réticule, I o Les offres d'emploi ============================================================ EDITORIAL ============================================================ L'inscription rapide est possible mais payante La nouvelle tendance qui semble s'affirmer aujourd'hui sur le Net place les outils annuaires en première position dans le coeur des internautes. Rappelons que la caractéristique principale de ce type d'outil est l'indexation par un opérateur humain, garantissant un filtrage de qualité avec pour conséquence des réponses pertinentes aux questions des utilisateurs. Nous pouvons résumer la situation en disant que l'entente utilisateurs-annuaires est cordiale et la satisfaction mutuelle. Le nombre d'utilisateurs et la valeur ajoutée reconnue de la pertinence des réponses sonne comme le chant d'une douce sirène aux oreilles des référenceurs et webmestres depuis fort longtemps. Chaque jour les soumissions se comptent par centaines et sont en augmentation constante -- ce qui est tout à fait logique, qualité rimant avec rendement. Mais cela pose quelques problèmes à ces mêmes annuaires. Effectivement, le nombre de demandes d'inscription est tel que les équipes de référenceurs-documentalistes doivent être à la hauteur, que ce soit en qualité ou en effectif. Ce qui ne semble pas être le cas pour le moment. L'internaute qui désire référencer un site sur un annuaire va se heurter à deux difficultés principales. Une sélection draconienne nécessaire, mais qui peut se révéler parfois injuste, et surtout -- c'est là que le bât blesse -- un délai trop long pour apparaître dans la base de données. Comment pallier ce problème ? Je pense que la réponse apparaît maintenant dans les pages de soumission de certains annuaires sous la forme d'une inscription garantie, rapide et payante : $79 USD, $199 USD ou $600 USD selon le service ou l'outil. Lancé par Yahoo! US depuis un bon moment, ce procédé a été repris par l'annuaire LookSmart avec pour principaux associés les moteurs mondiaux que sont AltaVista Directory, Excite et MSN. Cette association annuaires et moteurs de recherche a pour conséquence directe la constitution sous une nouvelle forme d'une base de données mondiale à péage qui sera peut-être la norme demain. En tout cas, nous pouvons sentir l'effort de certains outils prêts à utiliser leur position dominante pour amener doucement les propriétaires de site à payer leur inscription. Si la tendance s'affirme, nous verrons bientôt ce genre de services proposés sur nos outils nationaux. Reste à savoir comment vont réagir les utilisateurs. Thomas BERTRAND ============================================================ BREVES ============================================================ o AltaVista, tous sites confondus, est la huitième destination choisie par les internautes ; parmi les outils de recherche les plus visités, il se place maintenant en deuxième position, derrière Yahoo!. Article en anglais à < http://live.altavista.com/scripts/editorial.dll?ei=2048733&ern=y > o Yahoo! lance Buzz, service qui renseigne sur les sites les plus cliqués à la suite de requêtes dans cinq domaines : général, télévision, musique, sports, films. < http://buzz.yahoo.com/ > o MotoServices.com, un guide de la moto. < http://www.motoservices.com/ > o Lancement du premier portail spécialisé France-Inde. Inscription des entreprises françaises à < http://franceindiabtob.com/annuaire.asp > o BonWeb propose le téléchargement d'un fichier composé de plusieurs milliers de signets tout sujet classés par catégories. < http://www.bonweb.com > o <> : Scrub the Web, moteur de recherche majeur, propose un référencement gratuit et pratique dans une vingtaine d'outils anglophones. < http://www.scrubtheweb.com/abs/submit/index.html > o Spide Tracker, système de veille référentielle sur plus de vingt outils de recherche, propose une démo gratuite pour tester son service. Démo gratuite à < http://www.spidetracker.com/demo/ > o E-Qualite, pour faire évaluer la qualité d'un site web. < http://www.e-qualite.com/ > o Référencor, assistant-conseil en référencement. < http://www.planete-commerce.com/referencement/assistants.html > o <>, par Laurent Soron ou comment découvrir les ficelles de la toile pour optimiser son référencement. < http://lsoron.free.fr/dossiers/refer/refer.html > o 12,8 millions d'internautes en France selon MMXI au 1er octobre 2000. Article complet en français à < http://www.webfaster.net/inter_nov_17_5_2000.html > o LookSmart a débarqué en France, il paraît ? Enfin, le domaine en <<.fr>> est toujours disponible ! o Copernic, société responsable de l'excellent métamoteur Copernic, vient de sortir Summarizer, un logiciel qui crée de courts résumés. Entretien exclusif avec le PDG de Copernic, M. Bouchard, dans le prochain numéro de <>. ============================================================ COURRIER DE CHASSE ============================================================ Après un contact avec Pierre Ruaz, nous avons décidé de publier son article sur les pages satellites. Il ouvre un débat auquel nous vous proposons de participer en ajoutant vos interventions à celles d'Olivier Andrieu et de Pierre Angeli ci-dessous. Suit une lettre de Jeffer posant une délicate question sur <>. Comment ça ! du dopage sur l'internet ? ----------------- Référencement, la fin des pages satellites ? de Pierre Ruaz, directeur général et fondateur de VisibleSite, < http://www.visiblesite.com/ > Les référenceurs professionnels utilisent depuis longtemps la technique des pages satellites, parfois appelées pages alias. Elle consiste à créer des pages thématiques copies de la page racine ou de pages du site à référencer, puis à en modifier le contenu source avec certaines balises HTML afin d'y placer des mots clés, avant de les soumettre aux outils de recherche. Cette méthodologie, redoutable lors de sa création, ne permet plus aujourd'hui d'atteindre les résultats escomptés ! En effet, ces pages destinées au référencement sont similaires à leurs pages d'origine, dont elles reprennent la composition et le code à l'identique, hormis les traditionnelles balises méta <>, <<description>> et <<keywords>>, modifiées afin d'y placer des mots clés différents. Or aujourd'hui de nombreux sites rencontrent des difficultés majeures pour leur référencement sur les outils de recherche de l'internet. Les technologies récentes, sites graphiques (Flash) ou dynamiques (CGI, CFM, ASP, etc.), sont mal reconnues par les outils de recherche, en particulier les moteurs, ou ne comportent pas dans leurs codes les éléments nécessaires à l'optimisation de leur positionnement, ce qui rend leur indexation aléatoire et inefficace. Les moteurs de recherche eux-mêmes ne cessent de modifier leurs algorithmes d'indexation, et nous savons qu'aujourd'hui le contenu textuel des pages soumises est fortement valorisé au détriment des sources HTML classiques. En effet, les moteurs accordent aujourd'hui plus d'importance au contenu textuel des sites qu'ils indexent qu'aux métatags et autres lignes de code qui leur étaient pourtant destinées à l'origine. Deux difficultés majeures militent contre les pages satellites. Elles reprennent les défauts de la page d'origine. Comme nous l'avons vu précédemment, les technologies les plus utilisées aujourd'hui pour le développement des pages ne sont pas reconnues par les moteurs ou ne permettent pas l'optimisation des contenus textuels. Dupliquer une page, c'est reproduire ses défauts, ce qui en limite fortement l'intérêt. Cette difficulté est parfois détournée en reproduisant <<en dur>> le contenu de la page ou son aspect visuel, ce qui n'est pas toujours simple à mettre en place, n'autorise plus l'actualisation permanente des pages et en contrepartie fait perdre le bénéfice de l'investissement pour son développement en augmentant les coûts. La page satellite est lourde à gérer. Une simple modification apportée sur la page d'origine est à reporter sur l'ensemble des pages modifiées. Les webmestres qui ont expérimenté cette méthodologie vous confirmeront le surcroît de travail que représentent le suivi et la mise à jour de ces pages, et la génération d'une marge d'erreur importante. En conclusion, les pages satellites ont été développées à une époque où le simple fait de placer quelques mots clés dans des balises reconnues par les moteurs était la source de leur optimisation lors de l'indexation par les moteurs de recherche. Depuis, avec l'évolution exponentielle de l'internet, le nombre de pages communiquant sur les mêmes mots clés s'est multiplié, tandis que les robots ont fait évoluer leurs méthodes d'indexation et ne valorisent plus pareillement le contenu des balises méta. La masse de travail induite pour un résultat aléatoire et en chute libre rend les pages satellites de moins en moins pertinentes, et nous amènent à rechercher de nouvelles solutions de valorisation des mots clés et de soumission pour optimiser la position des sites sur les moteurs de recherche. ------------------- L'opinion d'Olivier Andrieu, < http://www.abondance.com/ > Attention : une page alias n'a rien à voir avec une page satellite si on veut être rigoureux sur les termes. Je ne suis pas un spécialiste des pages alias et satellites (j'ai dû faire dix pages satellites dans ma vie et aucune page alias, en tout cas aucune officielle pour un client, juste des tests qui m'ont permis de voir l'<<étendue des dégâts>> ;-)) Je ne suis pas un fervent partisan des pages satellites et alias... :-) Pour moi, le temps des pages alias et satellites est clairement en voie de disparition et ce pour plusieurs raisons : les balises méta sont de moins en moins bien prises en compte par les moteurs (quand elles ne sont pas ignorées), les critères <<off the page>> (indice de popularité, indice de clics, etc.) deviennent prédominants, des offres de référencement et de positionnement payant (Google) voient le jour, etc. Les pages alias et satellites ont été des <<rustines>> utiles lorsqu'elles étaient bien utilisées, pour pallier les problèmes techniques posés par les sites qui avaient été réalisés sans tenir compte des critères de pertinence des moteurs. Mais il est clair qu'elles ne suffisent plus aujourd'hui. Les pages alias et satellites ne servent qu'au positionnement sur les moteurs de recherche. Or une majorité du trafic généré par les outils de recherche vient des annuaires (et la tendance va en s'accentuant), pour lesquels les pages satellites sont inopérantes. Donc... ------------------ Le point de vue de Pierre Angeli En fait les pages alias ne sont pas mortes et ne risquent pas de mourir de si tôt. Le texte que j'ai lu sur la page de VisibleSite m'a fait plutôt penser à une offre commerciale pour les pages VisibleDynamics qu'à autre chose. Lorsque l'on prépare une page alias, on fait attention d'une page à l'autre à corriger toutes les fautes précédentes mais aussi de modifier le code de telle manière qu'il ne soit pas exactement le même que celui de la page d'accueil. Pour quelles raisons ? Eh bien, d'une part parce que certains moteurs repèrent les copies de pages identiques et ensuite parce qu'une véritable page alias est toujours différente de la page copiée... Je vous fais grâce des différentes techniques de pages alias telles que les hallway pages, doorway pages et autres. Si l'auteur du texte a bien remarqué que les balises méta n'étaient plus guère prises en compte, il a dû remarquer ce qui les <<remplace>> (un tag HTML simple) et qui provoque un meilleur placement que les balises méta dans les plus gros moteurs... On aura toujours besoin de pages alias et les outils de recherche le savent bien. ------------------ Les requêtes bidons Bonjour et d'abord merci pour votre travail, je suis un grand fan :) Le vif du sujet : je suis intrigué, et j'espère ne pas être le seul, de voir Yahoo! et autres Hotmail parmi les requêtes les plus tapées au monde, et cela sans faillir depuis Mathusalem... Certains pensent que c'est parce que les gens sont des crétins, et que les newbies qui arrivent en continu sur le Net alimentent ce genre de requête débile. Débile parce qu'avec la communication d'un poids lourd comme Yahoo! en offline ou en online, les RealNames and Co, il faut l'être pour taper le mot <<yahoo>> sur un moteur de recherche ! Je trouve que cette hypothèse ne tient pas la route. J'en ai une autre, et j'aimerais avoir votre avis : un logiciel comme MoreClick permet de faire plusieurs milliers de requêtes bidons en passant par une liste de proxies... Ainsi si je fais la requête <<vente aux enchères>> sur AltaVista, je n'ai plus qu'a faire un copier-coller de l'URL < http://www.altavista.com/cgi-bin/query?q=%22vente+aux+ench%E8res%22&kl=XX&pg =q& Translate=on >, la balancer sur MoreClick direction AltaVista, et hop ! plein de requêtes <<vente aux enchères>> :) Mais oui, M. l'Investisseur, je vous assure, les ventes aux enchères sont très prisées par les internautes ;) et, regardez, on fait 10000 visites par jour, waouh ! Hé hé... Alors parano ? En tout cas, il est clair que, si les investisseurs avaient plus regardé le ratio entre le chiffre d'affaires et les visites d'un site, il y aurait peut-être un peu moins de start-down à l'heure actuelle. Bon, maintenant c'est peut-être ma tournure d'esprit, je n'ai rien en fait pour prouver mes dires. Qu'en pensent les vrais pros ? Jeffer ------------------ C2M Renseignements pris auprès de vrais professionnels, cette fraude est une réalité mais concerne un très faible pourcentage de sites. S'il est difficile de contrer techniquement ce genre de logiciel, une analyse poussée révèle sans erreur possible le gonflage artificiel des visites. Ce que ne manquent pas de faire les sociétés concernées par le problème, comme les régies publicitaires, en particulier. Attention au dopage ! T. B. ----Avertissement légal : les courriers qui seront envoyés à l'adresse < mailto:c2m@enfin.com > avec pour objet <<C2M-votre question>> sont susceptibles d'être publiés dans la rubrique <<Courrier de chasse>> du bulletin <<Chasseurs de moteurs>>. ============================================================ LES OUTILS DE RECHERCHE SPECIALISES Thomas BERTRAND ============================================================ Entreprises ======================= Nom : ADX Thème : ent