web-dev-qa-db-fra.com

distributed-computing

Meilleur système de fichiers distribué pour une ferme de stockage Linux standard

Rechercher/Trouver un fichier et son contenu dans Hadoop

Pourquoi la partition RDBMS n'est-elle pas tolérante dans le théorème CAP et pourquoi est-elle disponible?

Différence entre le cloud computing et l'informatique distribuée?

Calculez la médiane d'un milliard de nombres

Expliquer Apache ZooKeeper

Changer la taille du fichier fractionné dans Hadoop

Comment MPI_Scatter et MPI_Gather sont-ils utilisés à partir de C?

Méthode de réplication de la base de données sqlite sur plusieurs serveurs

qu'est-ce que le port zookeeper et son utilisation?

akka ou une alternative similaire pour golang pour prendre en charge la simultanéité distribuée?

Comment écrire dans CSV en Spark

Comment fonctionne la fonction d'agrégation Spark - aggregByKey?

Qu'est-ce qu'une tâche dans Spark? Comment le travailleur Spark exécute-t-il le fichier jar?

Convertir une chaîne simple d'une ligne en RDD dans Spark

Quelle est la difference entre cache et persist?

Multitraitement Python avec un cluster distribué

Paxos vs deux phases commit

Concaténation de jeux de données de différents RDD dans Apache spark using scala

Erreur Java Spark: la taille dépasse Integer.MAX_VALUE

Apache Spark vs Akka

"Cohérence éventuelle" vs "Cohérence finale forte" vs "Cohérence forte"?

Le moyen le plus simple d'installer les dépendances Python sur les nœuds exécuteurs Spark?

Spark - répartition () vs coalesce ()

Qu'est-ce qui détermine Kafka offset du consommateur?

Que sont les travailleurs, les exécuteurs, les cœurs dans le cluster Spark autonome?

Aplatissement des rangées dans l'étincelle

Découverte de service vs équilibrage de charge

Google Dataflow vs Apache Spark

Est-il possible d’ajouter des partitions à un sujet existant dans Kafka 0.8.2

Comment utiliser le consommateur multi-thread dans kafka 0.9.0?

Qu'est-ce que spark.driver.maxResultSize?

Comprendre la mise en cache, persister dans Spark

Décomposition de la structure imbriquée dans le cadre de données Spark

Déterminer le nombre optimal de partitions Spark en fonction des travailleurs, des cœurs et de la taille de DataFrame

pyspark: NameError: le nom 'spark' n'est pas défini

Signification de inter_op_parallelism_threads et intra_op_parallelism_threads

Impossible d'enregistrer le modèle à l'aide de model.save après multi_gpu_model dans Keras

Pourquoi ESB est considéré comme mauvais dans l'architecture des microservices

2PC vs Sagas (transactions distribuées)

Comment voir la progression de la tâche Dask Compute?

Stratégies de parallélisation pour l'apprentissage en profondeur

Quelle est la différence entre Cloud, Grid et Cluster?

Meilleure façon d'agréger plusieurs fichiers journaux de plusieurs serveurs

FileSystemWatcher vs polling pour surveiller les modifications de fichiers

Memcached avec Windows et .NET

Comment copier une branche Git locale sur un dépôt distant

Service de verrouillage distribué

alternative à memcached qui peut persister sur le disque

Utilisation de Zookeeper dans le monde réel

Recommandations de bus de service .net?

Services Web vs EJB vs RMI, avantages et inconvénients?

Quels problèmes d'évolutivité avez-vous rencontrés lors de l'utilisation d'un magasin de données NoSQL?

Fragmentation horizontale ou verticale dans les systèmes de gestion de base de données distribuée (DDBMS)

Validation en deux phases

Impossible de commencer une transaction distribuée

Qu'entendons-nous par «centile supérieur» ou latence basée sur TP?

L'opération n'a pas pu être effectuée car OLE le fournisseur de base de données "SQLNCLI11" pour le serveur lié n'a pas pu commencer une transaction distribuée

Kafka - Comment valider l'offset après chaque message en utilisant un consommateur de haut niveau?

Dans Apache Kafka, pourquoi ne peut-il pas y avoir plus d'instances de consommateurs que de partitions?

Microservices: Que sont les terminaux intelligents et les tubes muets?

Comment décider de la taille du cluster Kafka

Le verrou fourni n'est pas valide. Soit le verrou a expiré, soit le message a déjà été supprimé de la file d'attente

Flux tensoriel distribué: la différence entre la réplication dans le graphique et la réplication entre les graphiques

Comment fonctionne la formation asynchrone dans Tensorflow distribué?

paxos vs radeau pour l'élection du chef

Comment utiliser tous les cœurs de processeur en utilisant Dask?

Comment configurer Jaeger avec elasticsearch?

Synchronisation des transactions entre la base de données et le producteur Kafka

Solutions de dimensionnement pour MySQL (réplication, clustering)

Tracer avec C #

ORA-01654: impossible d'étendre l'index

PHP sessions dans un cluster d'équilibrage de charge - comment?

Quelle est la différence entre le Cloud Computing et le Grid Computing?

Cluster de base de données et équilibrage de charge

Singleton dans un environnement de cluster

Exécutables signés sous Linux

Que peut faire MATLAB que R ne peut pas faire?

Performances F # en calcul scientifique

Ecrire du code fortrain robuste et "moderne"

paramètre pour les scripts Shell démarré avec qsub

blas multithread en python / numpy

hachage de chaînes rapide, de grande largeur et non cryptographique en python

Grand graphique interactif avec environ 20 millions de points d'échantillonnage et gigaoctets de données

Sortie vraie ou fausse basée sur une probabilité

Alternatives à ZooKeeper? (service de coordination de cluster)

binning des données en python avec scipy/numpy

Web App: Haute disponibilité / Comment éviter un point de défaillance unique?

NodeJS | Cluster: Comment envoyer des données du maître à tous ou à un seul enfant / travailleur?

comment spécifier le fichier journal des erreurs et le fichier de sortie dans qsub

MPI: bloquant vs non bloquant

Définir l'utilisateur système hadoop pour le client intégré dans Java webapp

Python Erreur "FileExists" lors de la création du répertoire

Est-il possible d'ajouter des nœuds à un cluster Hadoop en cours d'exécution?

Différence entre le clustering et l'équilibrage de charge?

Clustering basé sur la matrice de distance

Erreur d'application Nodejs: liez EADDRINUSE lorsque vous utilisez pm2 deploy

La réplication de cluster/session de Tomcat ne se réplique pas correctement

Quel IDE pour le calcul scientifique et le traçage en Python?

Mon employé de Spark ne peut pas connecter Master. Quelque chose ne va pas avec Akka?