<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>KraukoBlog &#187; Kraukoblog &#8211; Recherche pour le mot clé : farechase</title>
	<atom:link href="http://kraukoblog.fr/tag/farechase/feed/" rel="self" type="application/rss+xml" />
	<link>http://kraukoblog.fr</link>
	<description>L’INDUSTRIE DU VOYAGE SOUS UN ANGLE TECHNO ET MARKETING</description>
	<lastBuildDate>Sun, 22 Jan 2012 17:57:02 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.3</generator>
		<item>
		<title>Le screen-scraping, une solution provisoire pour une industrie en pleine mutation</title>
		<link>http://kraukoblog.fr/2010/02/le-screen-scraping-une-solution-provisoire-pour-une-industrie-en-pleine-mutation/</link>
		<comments>http://kraukoblog.fr/2010/02/le-screen-scraping-une-solution-provisoire-pour-une-industrie-en-pleine-mutation/#comments</comments>
		<pubDate>Sat, 06 Feb 2010 14:54:05 +0000</pubDate>
		<dc:creator>Julia</dc:creator>
				<category><![CDATA[Techno]]></category>
		<category><![CDATA[cie aérienne]]></category>
		<category><![CDATA[easyjet]]></category>
		<category><![CDATA[expedia]]></category>
		<category><![CDATA[farechase]]></category>
		<category><![CDATA[globalisateur]]></category>
		<category><![CDATA[gne]]></category>
		<category><![CDATA[ryanair]]></category>
		<category><![CDATA[screen-scraping]]></category>
		<category><![CDATA[xml]]></category>

		<guid isPermaLink="false">http://www.kraukoblog.fr/?p=28</guid>
		<description><![CDATA[Qu&#8217;est ce que le screen-scraping ? D&#8217;où vient ce nom barbare ? A quoi cela sert-il ? Pourquoi est-il actuellement massivement utilisé ? Et surtout pourquoi peut-on prédire la fin de son utilisation ? Ce n’est plus à [...]]]></description>
			<content:encoded><![CDATA[<p><span class="wpGallery">Qu&#8217;est ce que le screen-scraping ?</span> D&#8217;où vient ce nom barbare ? A quoi cela sert-il ? Pourquoi est-il actuellement massivement utilisé ? Et surtout pourquoi peut-on prédire la fin de son utilisation ?</p>
<p><a href="http://www.kraukoblog.fr/wp-content/uploads/2010/01/robots.jpg" rel="lightbox[28]"><img class="size-medium wp-image-44   alignleft" style="margin-right: 5px;" title="Americain Airlines accusait ForeChase de lancer plus de 200 000 requêtes par jours sur son site web en 2003 – Ryanair se disait screen-scrapé par 200 robots issus de sites web différents en 2008" src="http://www.kraukoblog.fr/wp-content/uploads/2009/12/robots-300x201.jpg" alt="" width="300" height="201" /></a>Ce n’est plus à démontrer, l’arrivée d’internet à bouleversé l’industrie du tourisme : les connexions entre les acteurs se sont multipliées, les modes de consommation et d’accès aux produits ont évolué et la plupart des acteurs ne peuvent plus envisager leur distribution autrement que multi-canal. Pour le client final tout semble formidable, les prix sont plus compétitifs, les produits se diversifient… et la masse d’information grandissante qui naît du web est de mieux en mieux organisée. Quand aux acteurs de l’industrie, quelque soit leur cœur de métier initial, ils voient leurs business modèles évoluer. Avec ces évolutions, de nouveaux acteurs apparaissent ainsi qu’une nouvelle terminologie : méta-moteur, marque blanche, affiliation, flux xml, API, screen-scraping… et c’est d’ailleurs ce dernier que nous allons tenter d’éclairer.</p>
<h3>Qu’est ce que le screen-scraping ?</h3>
<p>Les techniques de screen-scraping apparaissent dans les années 1999-2000 lorsque internet commence à se développer. Elles seront en plein boom vers 2003, période où le contenu internet ne cesse de croître et où de nombreux comparateurs fond leur apparition. Elle sera également très utilisée chez les GNE et les agences on-line pour ce qui concerne l’e-tourisme.</p>
<p>Concrètement, le screen-scraping consiste à scanner le contenu d’un site afin de pouvoir le réutiliser sur un autre site. Pour faire cela, les screen-scrapper (sites qui utilisent le screen-scraping) se servent de robots identiques à ceux des moteurs de recherche (tels Googlebots ou Yahoo! Slurps). La seule différence étant que ces moteurs sont spécialisés dans les sites de e-commerce et qu’ils ont donc été « entraînés » à reconnaître certaines informations telles les prix ou les caractéristiques d’un produits… Un site marchand est constitué à partir d’un catalogue produits ou d’une base de données, ces robots ne peuvent pas y avoir accès, ainsi à partir de la lecture du code HTML des pages du site ils essaient de reconstituer au mieux le catalogue source ou la base de données.</p>
<h3>Business modèle des screen-scrapeur</h3>
<p>Parmi ces comparateurs, on va retrouver plusieurs business modèles. La majorité d’entre eux fonctionnent au coût par clic (CPC) ou au coût par action (CPA) et l’internaute sera systématiquement redirigé chez le marchand pour effectuer son achat. Le problème de ce modèle est que pour fonctionner l’acteur doit passer des accords aux préalables avec les sites marchands pour fixer sa rémunération. Ce modèle économique pose donc un problème de neutralité. D’autant plus que pour l’internaute ces accords commerciaux ne sont pas visibles, ainsi la plupart pensent que les résultats des comparateurs permettent de trouver les meilleurs prix du web.</p>
<p><a href="http://www.kraukoblog.fr/wp-content/uploads/2010/01/charte_comparateurs.jpg" rel="lightbox[28]"><img class="alignright size-full wp-image-87" title="Charte des comparateurs" src="http://www.kraukoblog.fr/wp-content/uploads/2010/01/charte_comparateurs.jpg" alt="" width="150" height="72" /></a></p>
<p>En 2007, 11 des 12 comparateurs français contrôlés par la DGCCRT (Direction générale de la consommation, de la concurrence et de la répression des fraudes) ont été rappelés à l’ordre.</p>
<p>D’autres ont fait le choix d’un business modèle calqué sur celui de Google. C&#8217;est-à-dire qu’ils proposent des résultats dits « naturels » censés représenter le maximum de ce qui se trouve sur le web et parallèlement à ces résultats ont trouvera des liens commerciaux sous forme de texte (ex Wego) ou de bannières (ex : Sprice).</p>
<p>Enfin le dernier modèle se retrouve surtout chez les agences de voyages on-line, en effet celles-ci de par leur positionnement d’agence ne peuvent pas se permettre de rediriger l’internaute sur le site d’une compagnie pour effectuer la réservation. Dans certain cas elles ont développé des connexions directes avec les fournisseurs, mais il existe aussi des cas ou faute d’accords ou de technologie elles ne peuvent s’y relier. Ainsi on trouve une forme de screen-scraping plus avancée qui en plus de scanner les prix des produits à également reproduits le moteur de réservation sur son propre site. Ce moteur permet à l’internaute de réserver sur le site de l’agence, il fonctionne comme un moteur en marque blanche à la seule différence qu’il n’a pas été fournit par le producteur mais créé par l’agence. Celle-ci pouvant ce rémunérer en ajoutant sa propre marge au prix du producteur. On retrouvera cette technique chez Govoyages, Lastminute, Edream, Atrapalo, ou encore Ebookers. Cette technique est l’une des plus controversée, car elle s’utilise le plus souvent sans le consentement du producteur.</p>
<h3>Problèmes posés par le screen-scraping<a name="proces_screen-scraping"></a></h3>
<p>Bien que massivement utilisée le screen-scraping pose des problèmes d’ordre technique (le passage d’un robot sur un site ralentit son fonctionnement), qualitatif (un robot mal paramétré peut être sources de nombreuses imprécisions voire d’erreur) et éthique (le screen-scraping fonctionne sans accords préalables et peut être source de dérive). Ce dernier point est d’ailleurs une source de conflits récurrente dans notre secteur :</p>
<p>* 2003 : <a title="FareChase vs AA" href="http://dallas.bizjournals.com/dallas/stories/2003/06/09/daily55.html">FareChase vs AA</a><br />
* 2004 : <a title="FareChase vs SWA" href="http://hews.files.wordpress.com/2008/04/southwest-outtask-screen-scraping.pdf">FareChase vs SouthWest Airlines</a><br />
* 2008 : <a title="Ryanair vs Agences en ligne" href="http://www.travolution.co.uk/articles/2008/08/27/1668/ryanair-screen-scraping-saga.html">Ryanair vs Agences en ligne</a><br />
* 2008 : <a title="EasyJet vs Expédia" href="http://www.theregister.co.uk/2008/06/27/easyjet_travel_sites_warned/">EasyJet vs Expédia</a></p>
<p>D’ailleurs, si l’on regarde le secteur du e-commerce en général, tous les comparateurs de produits autre que voyage ont laissé tomber le screen-scraping. A l’exception de Twenga, ils fonctionnent tous (Kelkoo, LeGuide, Achetezfacile.com…) avec l’envoi de catalogues aux formats XML.</p>
<p>Dans l&#8217;industrie du leisure travel, de part la complexité de l&#8217;offre, la tendance est plutôt au développement des API. Celles-ci permettent une connexion directe et fiable aux stocks d&#8217;un acteur et elles permettent également de sortir des standards imposés par les GDS (cf : <a href="/?p=16">cas Air Canada</a>).</p>
]]></content:encoded>
			<wfw:commentRss>http://kraukoblog.fr/2010/02/le-screen-scraping-une-solution-provisoire-pour-une-industrie-en-pleine-mutation/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>

