pandas.DataFrame.empty

2025-05-26

具体的には以下のようになります。

False を返す場合
- DataFrameに一つでもデータ（要素）が存在する場合。
- たとえDataFrame内のすべての要素が NaN (Not a Number) であっても、データが存在するとみなされるため、empty は False を返します。すべての要素が NaN のDataFrameが本当に「空」であると見なしたい場合は、dropna() メソッドで NaN を削除してから empty を確認する必要があります。
- DataFrameにデータがまったく含まれていない場合（行も列もゼロの場合）。
- 列は定義されているが、行が一つもない場合。
- 行は定義されているが、列が一つもない場合。

使用例

import pandas as pd
import numpy as np

# 1. 空のDataFrame
df_empty = pd.DataFrame()
print("空のDataFrame:")
print(df_empty)
print(f"df_empty.empty: {df_empty.empty}") # True を返す
print("-" * 30)

# 2. 列は定義されているが、行がないDataFrame
df_cols_only = pd.DataFrame(columns=['A', 'B', 'C'])
print("列は定義されているが、行がないDataFrame:")
print(df_cols_only)
print(f"df_cols_only.empty: {df_cols_only.empty}") # True を返す
print("-" * 30)

# 3. データが含まれるDataFrame
df_full = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
print("データが含まれるDataFrame:")
print(df_full)
print(f"df_full.empty: {df_full.empty}") # False を返す
print("-" * 30)

# 4. 全てNaNのDataFrame
df_nan = pd.DataFrame({'A': [np.nan], 'B': [np.nan]})
print("全てNaNのDataFrame:")
print(df_nan)
print(f"df_nan.empty: {df_nan.empty}") # False を返す（NaNもデータとみなされるため）
print("-" * 30)

# 5. 全てNaNのDataFrameからNaNを削除した場合
df_nan_dropped = df_nan.dropna()
print("全てNaNのDataFrameからNaNを削除した場合:")
print(df_nan_dropped)
print(f"df_nan_dropped.empty: {df_nan_dropped.empty}") # True を返す
print("-" * 30)

Pythonでは、空のリスト（[]）や辞書（{}）などは bool() で評価すると False となります。しかし、PandasのDataFrameでは、パフォーマンスや意図の明確化のため、bool(DataFrame) は ValueError を発生させます。

DataFrameが空であるかどうかをチェックする場合は、必ず df.empty 属性を使用する必要があります。

df_empty = pd.DataFrame()
# if df_empty: # これはエラーになる
#     print("Empty!")
if df_empty.empty:
    print("DataFrameは空です。")

bool(df) を使って空判定しようとする

エラーの状況
Pythonのリストや辞書のように、DataFrameを直接 if df: のようにブール値として評価しようとすると、ValueError が発生します。

import pandas as pd

df = pd.DataFrame()
# if df: # これを実行すると ValueError: The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
#     print("DataFrame is not empty")

理由
Pandas DataFrameは、単一の明確な真偽値を持つようには設計されていません。複数の要素が含まれるため、例えば「すべての要素がTrueならTrue」なのか、「一つでもTrueがあればTrue」なのかなど、その評価が曖昧になるためです。このため、Pandasは明示的な empty 属性の使用を強制します。

トラブルシューティング
常に df.empty を使用してDataFrameが空かどうかをチェックしてください。

df = pd.DataFrame()
if df.empty:
    print("DataFrameは空です。")
else:
    print("DataFrameは空ではありません。")

NaN (Not a Number) のみが含まれるDataFrameを「空」と誤解する

エラーの状況
DataFrameにデータは入っているものの、そのすべてが NaN である場合に、df.empty が False を返すため、「空ではない」と判断され、期待する処理が行われないことがあります。

import pandas as pd
import numpy as np

df_nan = pd.DataFrame({'A': [np.nan], 'B': [np.nan]})
print(df_nan)
print(f"df_nan.empty: {df_nan.empty}") # False
# df_nan.empty が True を返すことを期待していたが、実際は False

理由
NaN はPandasにおいて「欠損値」であり、「データが存在しない」こととは異なります。DataFrameのサイズ（行数と列数）がゼロでない限り、empty 属性は False を返します。

トラブルシューティング
DataFrameからすべての NaN 値を削除した後で空かどうかをチェックすることで、意図した通りの「実質的に空」であるかを判定できます。

df_nan = pd.DataFrame({'A': [np.nan], 'B': [np.nan]})
df_nan_dropped = df_nan.dropna(how='all') # 全てのNaNの行を削除
if df_nan_dropped.empty:
    print("NaNのみの行を削除すると、DataFrameは空になります。")
else:
    print("NaNのみの行を削除しても、DataFrameは空ではありません。")

# または、特定の列に有効な値があるかどうかをチェックする
if df_nan['A'].dropna().empty and df_nan['B'].dropna().empty:
    print("すべての列がNaNのみで構成されています。")

条件によってDataFrameが空になる可能性がある処理の後のハンドリング不足

エラーの状況
フィルタリング、結合 (merge/join)、グループ化 (groupby) などの操作を行った結果、DataFrameが空になる可能性があるにもかかわらず、その後の処理で空のDataFrameを前提としないコードを書いてしまうと、KeyError や AttributeError などが発生することがあります。

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': ['x', 'y', 'z']})

# 存在しない条件でフィルタリング
filtered_df = df[df['A'] > 100]
print(f"filtered_df:\n{filtered_df}")
print(f"filtered_df.empty: {filtered_df.empty}") # True

# 空のDataFrameに対して列にアクセスしようとする（一般的なエラー）
# print(filtered_df['B'].iloc[0]) # IndexError: single positional indexer is out-of-bounds
# print(filtered_df.loc[0, 'B']) # KeyError: 0

理由
DataFrameが空の場合、行も列も存在しないため、インデックスや列名を使って要素にアクセスしようとするとエラーになります。

トラブルシューティング
DataFrameに対して何らかの操作を行う前に、または操作後に、empty 属性を使ってDataFrameが空でないことを確認してから、その後の処理に進むようにします。

df = pd.DataFrame({'A': [1, 2, 3], 'B': ['x', 'y', 'z']})

filtered_df = df[df['A'] > 100]

if not filtered_df.empty:
    print("フィルタリングされたDataFrameにデータがあります:")
    print(filtered_df)
    # ここにデータがある場合の処理
else:
    print("フィルタリングされたDataFrameは空です。")
    # ここにデータがない場合の処理 (例: ログ出力、代替処理)

# 関数内でDataFrameを返す場合も同様
def process_data(df_input):
    processed_df = df_input[df_input['value'] > 10]
    if processed_df.empty:
        print("処理結果のDataFrameは空です。")
        return None # または空のDataFrameを返す
    else:
        print("処理結果のDataFrame:")
        print(processed_df)
        return processed_df

df_test = pd.DataFrame({'value': [5, 8, 12]})
result_df = process_data(df_test)
if result_df is not None:
    # result_df を使った処理
    pass

df_empty_test = pd.DataFrame({'value': [1, 2, 3]})
result_empty_df = process_data(df_empty_test)

エラーの状況
pd.read_csv() や pd.read_excel() などで、ファイル自体が空、またはヘッダー行しかない場合、pandas.errors.EmptyDataError が発生することがあります。このエラーは df.empty をチェックする前に発生します。

# 仮の空ファイルを作成
with open("empty_file.csv", "w") as f:
    f.write("") # またはヘッダーのみ: f.write("col1,col2\n")

try:
    df_from_file = pd.read_csv("empty_file.csv")
    print(f"df_from_file.empty: {df_from_file.empty}")
except pd.errors.EmptyDataError as e:
    print(f"ファイルが空のためエラーが発生しました: {e}")

理由
EmptyDataError は、Pandasがデータを読み込もうとしたが、読み込むべきデータが見つからなかった場合に発生する例外です。これは、DataFrame.empty が評価されるよりも前の、データの読み込みフェーズで起こります。

トラブルシューティング
ファイルからデータを読み込む際には、try-except ブロックを使用して pandas.errors.EmptyDataError を捕捉し、適切にハンドリングします。

import pandas as pd
import numpy as np
import os

file_path = "data.csv"

# テスト用のファイルを作成 (データあり)
with open(file_path, "w") as f:
    f.write("col1,col2\n1,A\n2,B\n")

try:
    df = pd.read_csv(file_path)
    if df.empty:
        print(f"ファイル '{file_path}' から読み込んだDataFrameは空です。")
    else:
        print(f"ファイル '{file_path}' からデータを読み込みました:")
        print(df)
except pd.errors.EmptyDataError:
    print(f"ファイル '{file_path}' は空か、またはヘッダーのみです。")
except FileNotFoundError:
    print(f"ファイル '{file_path}' が見つかりません。")
except Exception as e:
    print(f"データの読み込み中に予期せぬエラーが発生しました: {e}")
finally:
    # テスト用ファイルの削除
    if os.path.exists(file_path):
        os.remove(file_path)

# テスト用のファイルを作成 (空)
file_path_empty = "empty_data.csv"
with open(file_path_empty, "w") as f:
    pass # 空ファイル

try:
    df_empty_file = pd.read_csv(file_path_empty)
    if df_empty_file.empty:
        print(f"ファイル '{file_path_empty}' から読み込んだDataFrameは空です。")
    else:
        print(f"ファイル '{file_path_empty}' からデータを読み込みました:")
        print(df_empty_file)
except pd.errors.EmptyDataError:
    print(f"ファイル '{file_path_empty}' は空か、またはヘッダーのみです。")
except FileNotFoundError:
    print(f"ファイル '{file_path_file}' が見つかりません。")
except Exception as e:
    print(f"データの読み込み中に予期せぬエラーが発生しました: {e}")
finally:
    # テスト用ファイルの削除
    if os.path.exists(file_path_empty):
        os.remove(file_path_empty)