web-dev-qa-db-fra.com

Quelle est la différence entre dataset et database?

Quelle est la différence entre dataset et database? Si elles sont différentes, alors comment?

Pourquoi les énormes données sont difficiles à gérer par base de données aujourd'hui.

S'il vous plaît répondre indépendamment de tout langage de programmation.

11
Lokesh Sah

En anglais américain, base de données signifie généralement "une collection organisée de données". Une base de données est généralement sous le contrôle d'un système de gestion de base de données, qui est un logiciel qui gère, entre autres, l'accès à la base de données par plusieurs utilisateurs. (Habituellement, mais pas nécessairement. Certaines bases de données simples ne sont que des fichiers texte traités avec des langages interprétés comme awk et Python.) 

Dans le monde SQL, ce que je connais le mieux, une base de données comprend des éléments tels que des tables, des vues, des procédures stockées, des déclencheurs, des autorisations et des données.

Encore une fois, en anglais américain, dataset fait généralement référence aux données sélectionnées et organisées en lignes et en colonnes pour le traitement par un logiciel statistique. Les données peuvent provenir d'une base de données, mais ce n'est peut-être pas le cas.

Un ensemble de données est constitué des données ... généralement dans une table ou peut être du type XML ou d'autres types de données, mais il ne s'agit que de données ... il ne fait vraiment rien.

Et comme vous le savez, une base de données est un conteneur pour le jeu de données, généralement avec une infrastructure intégrée pour interagir avec elle.

Des données énormes ne sont pas difficiles à gérer pour ce que je fais. Je suppose que vous posez une question liée à l'étude?

4
jetgrrrl

Le jeu de données est simplement un ensemble de données (peut-être lié à une personne et ne pas l'être à une autre), tandis que la base de données est un composant sw/hw qui organise et stocke des données ou un jeu de données. Les deux sont des choses différentes pratiquement.

Des données volumineuses nécessitent davantage d'infrastructure et de composants (h/w & s/w) ou de puissance de calcul et de stockage pour un stockage ou une récupération efficace des données. Plus de données volumineuses signifie plus de composants, donc difficiles. La base de données moderne fournit une bonne infrastructure pour gérer le traitement de données volumineuses (en lecture/écriture), ainsi que la gestion de la datalake par Microsoft. 

0
Maiden