{"id":90,"date":"2013-06-22T23:07:25","date_gmt":"2013-06-22T23:07:25","guid":{"rendered":"https:\/\/www.aya.io\/ayablog\/?p=90"},"modified":"2022-02-06T23:07:38","modified_gmt":"2022-02-06T23:07:38","slug":"deep-web-search","status":"publish","type":"post","link":"https:\/\/www.aya.io\/blog\/deep-web-search\/","title":{"rendered":"Recherche dans le Web profond"},"content":{"rendered":"<p>Il n'y a pas que Google dans la vie...<\/p>\n<p>Sans aucune pr\u00e9tention d'exhaustivit\u00e9, je vous propose quelques <strong>tr\u00e8s efficaces<\/strong> liens vers des moteurs et outils de recherche alternatifs.<\/p>\n<p>Si Google ne trouve pas ce que vous cherchez, si les forums sont vides de r\u00e9ponses, pas de panique&nbsp;: il y a toujours des solutions de secours.<\/p>\n<p><!-- more --><\/p>\n<p>Pour effectuer une recherche &quot;alternative&quot;, donc, ou plut\u00f4t &quot;en profondeur&quot;, nous allons nous tourner vers des outils qui iront piocher leurs informations dans des zones de l'Internet que Google indexe mal ou pas du tout.<\/p>\n<p>Ce que l'on nomme le &quot;deep web&quot; repr\u00e9sente en effet toute la partie immerg\u00e9e de l'iceberg, la partie invisible du Web et du Net, qui repr\u00e9sente ,tout comme son analogue, environ... 90%&nbsp;!<\/p>\n<p>Evidemment il est impossible de savoir r\u00e9ellement ce que Google n'indexe pas, mais il est \u00e9vident, pour des raisons techniques, que le bras arm\u00e9 de l'entreprise la plus puissante du monde ne fait qu'effleurer la surface des choses.<\/p>\n<p>En effet, Google ne va pas au-del\u00e0 des mots de passe de sites prot\u00e9g\u00e9s, ne rentre pas dans les r\u00e9pertoires FTP, n'indexe pas le contenu g\u00e9n\u00e9r\u00e9 par les web apps, encore moins les bases de donn\u00e9es des universit\u00e9s, ni les fichiers financiers des entreprises c\u00f4t\u00e9es en bourse, etc.<\/p>\n<p>Ne parlons m\u00eame pas des gigantesques et labyrinthiques Intranet, les serveurs d'emails publics et autres d\u00e9p\u00f4ts de binaires NNTP...<\/p>\n<p>Bref, pour tenter d'acc\u00e9der \u00e0 cette immense portion d'un Internet public mais difficilement accessible, Google ne sert \u00e0 rien.<\/p>\n<p>Et bien \u00e9videmment, Google et ses concurrents ne savent que proposer les r\u00e9sultats les plus demand\u00e9s par les autres personnes, et ne se pr\u00e9occuppent ni des r\u00e9sultats plus confidentiels ni d'essayer de comprendre ce que recherche l'internaute.<\/p>\n<h2>L'in\u00e9vitable<\/h2>\n<p>Quand on recherche des informations concernant la connaissance, la culture, les sciences, l'histoire, etc, un r\u00e9flexe commun est d'aller voir sur Wikipedia.<\/p>\n<p>C'est bien, mais c'est parfois impr\u00e9cis, et ne couvre pas certains domaines.<\/p>\n<h3>WOLFRAM ALPHA<\/h3>\n<p>Je ne vais pas me lancer dans une \u00e9loge de Steven Wolfram, mais juste pr\u00e9ciser que c'est une de mes idoles de l'\u00e8re moderne.<\/p>\n<p>Cet homme a d\u00e9j\u00e0 cr\u00e9e plusieurs petites r\u00e9volutions, par exemple <a href=\"https:\/\/www.wolfram.com\/mathematica\/\">Mathematica<\/a>.<\/p>\n<p>Mais son oeuvre essentielle, en tout cas celle qui nous touche directement, c'est <a href=\"http:\/\/www.wolframalpha.com\/\">Wolfram Alpha<\/a>.<\/p>\n<blockquote>\n<p>WolframAlpha est un service internet qui r\u00e9pond directement \u00e0 la saisie de questions factuelles en anglais par le calcul de la r\u00e9ponse, au lieu de procurer une liste de documents ou de pages web pouvant contenir la r\u00e9ponse.<\/p>\n<\/blockquote>\n<p>C'est simple&nbsp;: posez une question en anglais, et si la r\u00e9ponse est calculable, ou peut \u00eatre assembl\u00e9e \u00e0 partir de donn\u00e9es factuelles, alors Wolfram Alpha la trouvera et la formulera de mani\u00e8re compr\u00e9hensible.<\/p>\n<p>Rien que \u00e7a&nbsp;!<\/p>\n<p>Essayez, c'est \u00e9tonnant. En fait, c'est G\u00c9NIAL.<\/p>\n<p>Exemples&nbsp;:<\/p>\n<pre><code>compare the Paris and London population<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/aya.io\/blog\/images\/paris-london-wolfram.jpg\" alt=\"\" \/><\/p>\n<pre><code>distance of planets from earth<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/aya.io\/blog\/images\/planets-wolfram.jpg\" alt=\"\" \/><\/p>\n<pre><code>what are the largest city populations<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/aya.io\/blog\/images\/largest-cities-wolfram.jpg\" alt=\"\" \/><\/p>\n<pre><code>flights over new york now<\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/aya.io\/blog\/images\/flights-newyork-wolfram.jpg\" alt=\"\" \/><\/p>\n<h4>Extension<\/h4>\n<p>Au lieu d'aller directement sur le site web de WolframAlpha, on peut utiliser cette pratique <a href=\"http:\/\/www.wolframalpha.com\/extensions\/chrome-extension.html\">extension pour Chrome<\/a>.<\/p>\n<h4>Terminal<\/h4>\n<p>On peut aussi faire une recherche en ligne de commande avec <a href=\"http:\/\/saironiq.blogspot.fr\/2012\/04\/wolframalpha-cli-interface.html\">cet outil<\/a>.<\/p>\n<h4>Siri<\/h4>\n<p>Si votre iPhone est configur\u00e9 en langue anglaise, alors vous profiterez de Wolfram Alpha dans Siri sans rien avoir \u00e0 faire de particulier.<\/p>\n<h3>GALLICA<\/h3>\n<p>M\u00e9connu, le <a href=\"http:\/\/gallica.bnf.fr\/\">site de la Biblioth\u00e8que Nationale de France<\/a> est un tr\u00e9sor pour qui effectue des recherches dans les oeuvres litt\u00e9raires de toutes \u00e9poques.<\/p>\n<p>En effet, un \u00e9norme travail de num\u00e9risation et d'archivage a \u00e9t\u00e9 effectu\u00e9 (et continue), et est accessible par le web.<\/p>\n<p>Non seulement pour acc\u00e9der au contenu textuel, qui est d\u00e9j\u00e0 incroyablement \u00e9norme, mais aussi au contenu pictural (gravures, illustrations) contenu dans les livres anciens.<\/p>\n<p>Par exemple, une recherche sur <a href=\"http:\/\/gallica.bnf.fr\/Search?ArianeWireIndex=index&amp;amp;p=1&amp;amp;lang=FR&amp;amp;q=bal+de+la+ville+de+paris\">bal de la ville de Paris<\/a> nous donne&nbsp;:<\/p>\n<p><img decoding=\"async\" src=\"https:\/\/aya.io\/blog\/images\/bal-paris-gallica.jpg\" alt=\"\" \/><\/p>\n<h3>IXQUICK<\/h3>\n<p><a href=\"https:\/\/www.ixquick.com\/fra\/\">Ixquick<\/a> est un moteur de recherche confidentiel (qui ne conserve pas votre IP ni vos recherches), qui se vante d'\u00eatre plus puissant et plus pr\u00e9cis que Google.<\/p>\n<p>M\u00eame si cette performance reste \u00e0 prouver, il est \u00e9vident ques les r\u00e9sultats fournis par Ixquick sont souvent pertinents.<\/p>\n<h3>Duck Duck Go<\/h3>\n<p>D\u00e9j\u00e0 bien connu, <a href=\"https:\/\/duckduckgo.com\/\">Duck Duck Go<\/a> est \u00e9galement respectueux de votre vie priv\u00e9e.<\/p>\n<p>Il propose aussi des r\u00e9sultats souvent plus orient\u00e9s &quot;culture&quot; que Google, m\u00eame s'il ne va pas forc\u00e9ment les chercher plus loin. C'est d\u00e9j\u00e0 bien pratique.<\/p>\n<p>Surtout, le moteur se vante d'\u00eatre totalement anonymis\u00e9, et donc permet de faire des recherches sensibles sans \u00eatre enregistr\u00e9 par Google et ses grandes oreilles.<\/p>\n<p>Il y a aussi une extension disponible.<\/p>\n<p><img decoding=\"async\" src=\"https:\/\/aya.io\/blog\/images\/duckduckgo.jpg\" alt=\"\" \/><\/p>\n<h3>VLIB<\/h3>\n<p>La <a href=\"http:\/\/vlib.org\/\">VLIB<\/a>, autrement dit la Virtual Library, est un projet cr\u00e9\u00e9 par Tim Berners-Lee, l'inventeur m\u00eame du Web.<\/p>\n<p>C'est un projet qui essaie d'archiver un grand nombre de r\u00e9sultats de recherche et de documents librement ou l\u00e9galement accessibles.<\/p>\n<p>Projet contributif, c'est une excellente et puissante alternative \u00e0 Wikipedia, mais qui demande un peu plus de patience, n'\u00e9tant pas forc\u00e9ment bien <em>filtr\u00e9e<\/em> ni organis\u00e9e.<\/p>\n<p><img decoding=\"async\" src=\"https:\/\/aya.io\/blog\/images\/vlib.jpg\" alt=\"\" \/><\/p>\n<h3>INFOMINE<\/h3>\n<p>Dans le m\u00eame genre, mais initi\u00e9 par la Biblioth\u00e8que de l'Universit\u00e9 de Californie, <a href=\"http:\/\/infomine.ucr.edu\/\">InfoMine<\/a> permet de faire des recherches dans des documents n'\u00e9tant pas index\u00e9s par les moteurs de recherche classiques.<\/p>\n<p>De nombreux domaines sont accessibles&nbsp;: m\u00e9dical, business, gouvernemental, g\u00e9ographie, arts, etc.<\/p>\n<h3>BASE<\/h3>\n<p>Toujours dans le m\u00eame domaine&nbsp;: <a href=\"http:\/\/www.base-search.net\/\">BASE<\/a> essaie d'indexer les bases de donn\u00e9es des biblioth\u00e8ques en acc\u00e8s public.<\/p>\n<p><strong>Toutes<\/strong> les biblioth\u00e8ques... ce sont l\u00e0 des tonnes d'information que Google ignore compl\u00e8tement.<\/p>\n<h3>SCIRUS<\/h3>\n<p>Moteur de recherche de documents scientifiques, <a href=\"http:\/\/www.scirus.com\/srsapp\/\">Scirus<\/a> permet par exemple d'effectuer des fouilles dans les brevets am\u00e9ricains, les publications scientifiques pas encore officiellement publi\u00e9es, la presse universitaire, etc.<\/p>\n<h3>TECHXTRA<\/h3>\n<p>Dernier repr\u00e9sentant du genre, <a href=\"http:\/\/www.techxtra.ac.uk\/\">TechXtra<\/a>, sous ses airs has-been, permet en fait de faire des recherches parmi toutes les publications \u00e9tudiantes du domaine public&nbsp;: th\u00e8ses, essais, doctorats, etc.<\/p>\n<h3>TINEYE<\/h3>\n<p>Peu connue, la fonction de recherche d'images <em>par le contenu<\/em> de Google est relativement efficace&nbsp;: on upload une image, et le moteur essaie de trouver toutes les images identiques ou similaires.<\/p>\n<p>Dans le m\u00eame genre mais avec une base de donn\u00e9es diff\u00e9rente, il y a donc <a href=\"http:\/\/tineye.com\/\">TinEye<\/a>, avec des fonctions originales, comme par exemple la recherche d'images par couleur, etc.<\/p>\n<h3>YASNI<\/h3>\n<p><a href=\"http:\/\/www.yasni.fr\/\">Yasni<\/a> permet de rechercher des informations sur des personnes.<\/p>\n<p>C'est assez troublant...<\/p>\n<p>Pour peu que vous ayez une existence un tant soit peu publique sur le Web depuis quelques ann\u00e9es, ce site web va vous faire souffrir.<\/p>\n<h3>QWANT<\/h3>\n<p>Initiative fran\u00e7aise, <a href=\"http:\/\/www.qwant.com\/\">Qwant<\/a> se veut \u00eatre un moteur plus global que Google.<\/p>\n<p>De mon exp\u00e9rience, c'est surtout un moteur pratique pour explorer l'actualit\u00e9 ou les \u00e9v\u00e8nements rapport\u00e9s publiquement en certains endroits ou certaines p\u00e9riodes.<\/p>\n<p>Exemple&nbsp;:<\/p>\n<p><img decoding=\"async\" src=\"https:\/\/aya.io\/blog\/images\/qwant.jpg\" alt=\"\" \/><\/p>\n<h3>CNRS<\/h3>\n<p>Entre autres sites permettant d'acc\u00e8der aux documents institutionnels, celui du <a href=\"http:\/\/www.cnrs.fr\/rechercher\/\">CNRS<\/a> est un des plus pertinents.<\/p>\n<p>Exemple&nbsp;:<\/p>\n<p><img decoding=\"async\" src=\"https:\/\/aya.io\/blog\/images\/cnrs.jpg\" alt=\"\" \/><\/p>\n<h3>BLEKKO<\/h3>\n<p><a href=\"http:\/\/blekko.com\/\">Blekko<\/a> est un moteur permettant d'obtenir des r\u00e9ponses filtr\u00e9es et s\u00e9lectionn\u00e9es.<\/p>\n<p>Si vous n'avez pas le temps de comparer et trier les r\u00e9sultats des principaux moteurs de recherche, alors essayez ce site.<\/p>\n<p>C'est un peu trop ax\u00e9 sur les donn\u00e9es <em>mainstream<\/em> mais \u00e7a marche plut\u00f4t bien.<\/p>\n<h3>CREATIVE COMMONS<\/h3>\n<p>Vous recherchez du contenu utilisable librement, que ce soient des images, des logos, du texte ou des photos&nbsp;?<\/p>\n<p>Essayez ce site de m\u00e9ta-recherche de documents sous licence <a href=\"http:\/\/search.creativecommons.org\/\">Creative Commons<\/a>.<\/p>\n<h3>PIXSY<\/h3>\n<p><a href=\"http:\/\/www.pixsy.net\/\">Pixsy<\/a> est un m\u00e9ta-moteur de recherche utilisable avec des raccourcis clavier.<\/p>\n<p>Pixsy utilise, selon vos crit\u00e8res, des r\u00e9sultats provenant de plusieurs dizaines de sites, dont Amazon, Wikipedia, etc.<\/p>\n<p>C'est en quelque sorte un point central pour qui aurait besoin d'effectuer des recherches nombreuses parmi un grand \u00e9ventail de contextes.<\/p>\n<h3>SEEKS<\/h3>\n<p>Plus anecdotique, <a href=\"http:\/\/www.seeks.fr\/\">Seeks<\/a> est un moteur de recherche d\u00e9centralis\u00e9 contributif.<\/p>\n<p>Les volontaires installent la <a href=\"http:\/\/www.seeks-project.info\/site\/\">version serveur<\/a> de Seeks sur leurs \u00e9quipements et participent \u00e0 l'indexage du Web.<\/p>\n<p>La page de recherche de Seeks utilise alors ces r\u00e9sultats pour vous proposer des r\u00e9ponses \u00e0 votre recherche.<\/p>\n<h3>Non-Web<\/h3>\n<p>Il existe \u00e9galement, mais cela m\u00e9riterait un autre article, tout ce qui n'appartient pas au Web mais qui est tout le reste de l'Internet.<\/p>\n<p>Les millions de posts sur les forums de discussion publics non censur\u00e9s dits <em>Newsgroups<\/em> (protocole NNTP), les bases de donn\u00e9es financi\u00e8res, m\u00e9t\u00e9orologiques et autres <em>Big Data<\/em>, etc.<\/p>\n<p>Le Web est incroyablement immense, mais l'Internet est immens\u00e9ment plus grand encore&nbsp;!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Il n&rsquo;y a pas que Google dans la vie&#8230; Sans aucune pr\u00e9tention d&rsquo;exhaustivit\u00e9, je vous propose quelques tr\u00e8s efficaces liens vers des moteurs et outils de recherche alternatifs. Si Google ne trouve pas ce que vous cherchez, si les forums sont vides de r\u00e9ponses, pas de panique&nbsp;: il y a toujours des solutions de secours.&hellip; <a class=\"more-link\" href=\"https:\/\/www.aya.io\/blog\/deep-web-search\/\">Poursuivre la lecture <span class=\"screen-reader-text\">Recherche dans le Web profond<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":91,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[23,9],"tags":[],"class_list":["post-90","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-culture","category-dossier","entry"],"_links":{"self":[{"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/posts\/90","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/comments?post=90"}],"version-history":[{"count":2,"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/posts\/90\/revisions"}],"predecessor-version":[{"id":93,"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/posts\/90\/revisions\/93"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/media\/91"}],"wp:attachment":[{"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/media?parent=90"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/categories?post=90"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.aya.io\/blog\/wp-json\/wp\/v2\/tags?post=90"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}