Je me brise la tête dessus maintenant. Je suis nouveau dans ces fichiers parquet
et je rencontre beaucoup de problèmes avec elle.
Je suis projeté une erreur qui lit OSError: Passed non-file path: \datasets\proj\train\train.parquet
Chaque fois que j'essaie de créer un df
à partir de celui-ci.
J'ai essayé ceci: pq.read_pandas(r'E:\datasets\proj\train\train.parquet').to_pandas()
et od = pd.read_parquet(r'E:\datasets\proj\train\train.parquet', engine='pyarrow')
J'ai également changé la lettre de lecteur du lecteur où réside le jeu de données, et c'est la même chose!
C'est la même chose avec tous les moteurs.
S'il vous plaît aider!
Cela pourrait être un problème avec la manipulation du chemin de fichier de Flèche. Vous pouvez plutôt passer dans un fichier déjà ouvert:
import pandas as pd
with open(r'E:\datasets\proj\train\train.parquet', 'rb') as f:
df = pd.read_parquet(f, engine='pyarrow')