Cet article est le premier d’une série d’articles concernant HANA

 

J’ai eu fin décembre un cadeau de la part de SAP – l’opportunité de “jouer” avec une machine virtuelle SAP HANA.

A première vue, c’est assez perturbant – pas de SAPGui, juste BO sous Excel, et le ‘SAP HANA Studio’ permettant de créer des objets (Tables, vues, etc.) sous HANA, et de les manipuler en ligne de commande SQL.

Jeu de données test

Pour avoir une idée des performances d’HANA, il faut avoir une bonne base de données. Il me parait clair qu’une centaine de lignes dans une table ne va pas nous permettre de savoir si HANA est plus rapide qu’Oracle, ou même MySQL !

M’inspirant largement sur cet article [http://www.mysqlperformanceblog.com/2009/10/02/analyzing-air-traffic-performance-with-infobright-and-monetdb/], j’ai donc passé quelques jours à télécharger, nettoyer et mettre en forme la liste quasi-exhaustive des vols commerciaux des Etats-Unis, de Janvier 1988 à Octobre 2011.

Il y a toutes sortes d’informations intéressantes dans le fichier, par exemple les aéroports de départ et d’arrivée, heure et date de vol, mais aussi nombre de minutes de retard, temps de vol, … – de quoi faire pas mal d’analyses ‘pur SQL’, facilement reproductibles entre différents types de base de données.