web-dev-qa-db-fra.com

dask

Comment utiliser tous les cœurs de processeur en utilisant Dask?

python dask DataFrame, support pour les lignes (trivialement parallélisables)

comment paralléliser de nombreuses comparaisons de chaînes (floues) à l'aide de apply in Pandas?

Dans quelle situation puis-je utiliser Dask au lieu d'Apache Spark?

Écriture de partitions Dask dans un seul fichier

dask dataframe comment convertir la colonne en to_datetime

Convertir Pandas dataframe en Dask dataframe

Dask peut-il paralléliser la lecture d'un fichier csv?

L'installation par défaut de Dask dans pip donne "ImportError: Aucun module nommé toolz"

Dask: Comment pourrais-je paralléliser mon code avec un dask retardé?

dask dataframe appliquer la méta

Stratégie de partitionnement efficace des trames de données dask

Données imbriquées dans Parquet avec Python

Comment paralléliser apply () sur Pandas Dataframes utilisant tous les cœurs d'une machine?

exemple simple de map_partitions dask

Comment voir la progression de la tâche Dask Compute?

Débit d'air + céleri ou dask. Pour quoi, quand?

Comment forcer les types de parquet lors de la sauvegarde de pd.DataFrame?

Comment dois-je obtenir la forme d'une base de données Dask?

Une comparaison entre fastparquet et pyarrow?

Comparaison entre modin | Dask | Données.table | Pandas pour le traitement parallèle et les fichiers CSV de mémoire de mémoire

Un moyen efficace de lire des fichiers csv de 15 M lignes dans python

Application de Python function à Pandas grouped DataFrame - quelle est l'approche la plus efficace pour accélérer les calculs?