Une question se pose actuellement pour le projet d’actualité scientifique en ligne, faut-il ou non utiliser une base de donnée pour stocker les news des flux RSS ?
En premier lieu il y a la question de rapidité entre un parsage des flux distants et une lecture dans une base de donnée locale. Mais puisque nous avons opté pour l’utilisation d’un cache pour les pages dynamiques le problème ne se pose pas. L’accès aux flux ou à la base de donnée ne se fait que périodiquement pour rafraîchir le cache.
La solution la plus simple reste donc d’utiliser directement les flux RSS sans passer par une base de donnée. Mais si on veut ajouter quelques fonctions avancées au site cela peut s’avérer intéressant. En particulier pour implémenter un moteur de recherche ou une liste de news sur le même thème par exemple.
Reste à faire une liste de ces fonctions supplémentaires que pourrait apporter le site (n’hésitez pas à m’en suggérer par le biais des commentaires) et à étudier leurs faisabilités. Par exemple il faut tenir compte du fait que la news n’est qu’un lien vers un article sur un autre site Internet. Si on garde en mémoire dans une base de donnée ces liens il faut qu’ils restent valides, ce qui n’est pas forcement le cas de tous les sites.
Un dernier intérêt de la base de donnée est qu’ensuite il serait possible de grouper les news identiques en provenance de divers sites… Mais cela un grand moteur de recherche le fait déjà !
