Comment résoudre l'objet attribut 'float' d'erreur n'a pas d'attribut 'split' en python?

Question

Lorsque j'exécute le code ci-dessous, cela me donne une erreur disant qu'il y a une erreur d'attribut: l'objet 'float' n'a pas d'attribut 'split' en python.

Je voudrais savoir pourquoi cette erreur se produit.

def text_processing(df): """""=== Lower case ===""" '''First step is to transform comments into lower case''' df['content'] = df['content'].apply(lambda x: " ".join(x.lower() for x in x.split() if x not in stop_words)) return df df = text_processing(df)

La trace complète de l'erreur:

Traceback (most recent call last): File "C:\Program Files\JetBrains\PyCharm Community Edition 2018.2.2\helpers\pydev\pydevd.py", line 1664, in <module> main() File "C:\Program Files\JetBrains\PyCharm Community Edition 2018.2.2\helpers\pydev\pydevd.py", line 1658, in main globals = debugger.run(setup['file'], None, None, is_module) File "C:\Program Files\JetBrains\PyCharm Community Edition 2018.2.2\helpers\pydev\pydevd.py", line 1068, in run pydev_imports.execfile(file, globals, locals) # execute the script File "C:\Program Files\JetBrains\PyCharm Community Edition 2018.2.2\helpers\pydev\_pydev_imps\_pydev_execfile.py", line 18, in execfile exec(compile(contents+"
", file, 'exec'), glob, loc) File "C:/Users/L31307/Documents/FYP P3_Lynn_161015H/FYP 10.10.18 (Wed) still working on it/FYP/dataanalysis/category_analysis.py", line 53, in <module> df = text_processing(df) File "C:/Users/L31307/Documents/FYP P3_Lynn_161015H/FYP 10.10.18 (Wed) still working on it/FYP/dataanalysis/category_analysis.py", line 30, in text_processing df['content'] = df['content'].apply(lambda x: " ".join(x.lower() for x in x.split() if x not in stop_words)) File "C:\Users\L31307\AppData\Roaming\Python\Python37\site-packages\pandas\core\series.py", line 3194, in apply mapped = lib.map_infer(values, f, convert=convert_dtype) File "pandas/_libs/src\inference.pyx", line 1472, in pandas._libs.lib.map_infer File "C:/Users/L31307/Documents/FYP P3_Lynn_161015H/FYP 10.10.18 (Wed) still working on it/FYP/dataanalysis/category_analysis.py", line 30, in <lambda> df['content'] = df['content'].apply(lambda x: " ".join(x.lower() for x in x.split() if x not in stop_words)) AttributeError: 'float' object has no attribute 'split'

Dominique Paul · Answer

split () est une méthode python qui ne s'applique qu'aux chaînes. Il semble que votre "contenu" de colonne contienne non seulement des chaînes mais aussi d'autres valeurs comme des flottants auxquels vous ne pouvez pas appliquer le .split ( ) mehthod.

Essayez de convertir les valeurs en chaîne en utilisant str (x) .split () ou en convertissant d'abord la colonne entière en chaînes, ce qui serait plus efficace. Vous procédez comme suit:

df['column_name'].astype(str)