Les bases de données des entreprises du Web

Quasiment aucune n'utilise Oracle, alors, quelle est leur solution?

 
Leur solution
Google Percolator pour le moteur de recherche. Successeur de BigTable, autre solution créée par Google.
Spanner. BD NewSQL distribuée et répliquée en temps réel, pour GMail et autres.
Facebook HBase. Dérivé de BigTable et fait partie de Hadoop, un ensemble d'outils.
MySQL. Pour les fonctions courantes. Surcouche TAO pour le graphe social.
Haystack. Pour les photos.
Hive. Ajoute l'analyse de données à Hadoop.
Schéma: Infrastructure de Facebook quand aux bases de données. (Source Malte Schwarzkopf).
Twitter Cassandra pour les statistiques et la géolocalisation.
MySQL. Un fork du gestionnaire, pour les utilisateurs et les tweets. Le code source est disponible sur GitHub.
FlockDB. Une base de données en graphe pour les connexions sociales. Le code source est aussi sur GitHub.
HBase et Hadoop. Sans doute pour remplacer MySQL.
Wikipedia MariaDB. Des clusters de wikis avec un accès commun. Programmé en PHP et JavaScript (30%).
Yahoo MySQL modifié. La compagnie a un temps eu le record de taille de tables SQL.
PostgreSQL dont la partie requête a été personnalisée.
eBay Hadoop avec Kylin, un système de recherche sur des masses de données. eBay a utilisé Oracle.
Digg DynamoDB qui est une solution NoSQL fournie par Amazon AWS, son hébergeur.
Netflix Cassandra.
Skype PostgreSQL. Utilisé avec PHP et autres langages de script.
Youtube MySQL + Vitesse pour l'adapter au cloud.
Uber A migré de PostgreSQL à MySQL (Percona) + Schemaless qui le rend NoSQL.
Utilise aussi Cassandra, Hadoop, MongoDB et Redis sous Node.js (Source)

Ceci n'est qu'un échantillon des entreprises les plus connues. Une multitude d'autres font appel à PostgreSQL, MariaDB (remplaçant de MySQL), HBase et les outils d'Hadoop.
Même si Cassandra a été délaissé par Facebook qui l'a créé, ce logiciel est cependant utilisée par une multitude d'autres entreprises dont les besoins sont différents.
Seule Amazon utilise Oracle, mais cette compagnie a aussi l'habitude de payer sans discuter les patent trolls, c'est une attitude cohérente.

On voit que pour les données structurées, les entreprises utilisent MariaDB (éventuellement en clusters) et PostgreSQL. Mais elles les utilisent aussi en combinaison avec d'autres outils pour les données en réseau.
L'expérience d'Uber à montré que PostgreSQL ne convient pas pour la mise à jour en masse de lignes et que MySQL ou dérivés sont plus rapides tant qu'on ne modifie pas la clé primaire. Postgre offre plus de possibilités cependant dans d'autres types d'usages.
Par ailleurs, d'autres types de bases de données conviennent mieux pour les applications très diverses du Web: tables NoSQL, documents, graphes de relations, clé-valeurs, etc...

Voir aussi...