socket.pause()だけじゃない！Node.jsストリーム制御のベストプラクティス

2025-05-27

具体的に何をするのか？

socket.pause() を呼び出すと、以下のようになります。

readable イベントへの影響
ソケットが読み取り可能になったことを示す 'readable' イベントも、socket.resume() が呼び出されるまで発生しないことがあります。
'data' イベントの停止
ソケットがデータを受信しても、'data' イベントが発生しなくなります。これは、データがあなたのプログラムに自動的に流れ込んでくるのを防ぎます。
データのバッファリング
ソケットに到着したデータは、内部バッファに蓄積されます。

なぜ socket.pause() を使うのか？

socket.pause() は、以下のような状況で役立ちます。

手動でのデータ読み取り
pause() を呼び出した後、socket.read() メソッドを使って、必要なタイミングで明示的にデータを読み取ることができます。
パイプ処理の制御
pipe() メソッドを使ってソケットのデータを別のストリームに流し込む際に、一時的にデータの流れを止めたい場合に利用します。例えば、特定の条件が満たされるまでデータの書き込みを遅らせたい場合などです。
データの処理速度の制御
受信したデータをすぐに処理できない場合、pause() を呼び出してデータの流入を一時的に止め、処理が追いついてから resume() で再開することができます。これは、リソースの過負荷を防ぐのに役立ちます。

socket.resume() との組み合わせ

socket.pause() で一時停止したデータの読み取りを再開するには、同じソケットオブジェクトに対して socket.resume() メソッドを呼び出します。resume() が呼び出されると、バッファリングされていたデータが 'data' イベントとして順次発行され始めます。

例

const net = require('net');

const server = net.createServer((socket) => {
  console.log('クライアントが接続しました');

  socket.on('data', (data) => {
    console.log('受信データ:', data.toString());

    // データ処理がまだ完了していない場合、一時的に読み取りを停止
    if (!dataProcessingComplete) {
      socket.pause();
      console.log('データの読み取りを一時停止しました');

      // 何らかの処理を行う（ここではsetTimeoutでシミュレート）
      setTimeout(() => {
        dataProcessingComplete = true;
        socket.resume(); // 処理完了後、読み取りを再開
        console.log('データの読み取りを再開しました');
      }, 2000);
    }
  });

  socket.on('end', () => {
    console.log('クライアントが切断しました');
  });
});

server.listen(3000, () => {
  console.log('サーバーがポート3000で起動しました');
});

let dataProcessingComplete = false;

この例では、クライアントからデータを受信した際に、dataProcessingComplete フラグが false であれば socket.pause() を呼び出してデータの読み取りを一時停止しています。2秒後に setTimeout で処理が完了したとみなし、socket.resume() を呼び出して読み取りを再開しています。

pause() したまま resume() を忘れる

トラブルシューティング
- pause() を呼び出す箇所を特定し、必ず対応する resume() が適切なタイミングで呼び出されるようにコードを見直してください。
- 非同期処理（コールバック、Promise、async/await）の中で pause() を使用する場合は、処理の完了後に必ず resume() を呼び出すように注意してください。try...finally ブロックを使用して、エラーが発生した場合でも resume() が実行されるようにすることも有効です。
- ログ出力などを活用して、pause() が呼び出された後、resume() が期待通りに呼び出されているかを確認してください。
エラー
socket.pause() を呼び出した後、対応する socket.resume() を呼び忘れると、ソケットからのデータの読み取りが永久に停止してしまいます。その結果、データがアプリケーションに流れ込まず、処理が進まなくなります。

意図しないタイミングでの resume()

トラブルシューティング
- resume() を呼び出す前に、必要なデータ処理が完了していることを確認するロジックを追加してください。
- 状態管理用の変数（上記の例の dataProcessingComplete のようなフラグ）を使用して、処理の状態を追跡し、適切なタイミングで resume() を呼び出すようにしてください。
エラー
データの処理が完了していないにもかかわらず socket.resume() を呼び出してしまうと、まだ処理の準備ができていない状態で新しいデータが流れ込んできてしまい、データの破損や予期せぬ動作を引き起こす可能性があります。

pipe() との併用時の問題

トラブルシューティング
- pipe() で接続されたストリームに対して pause() や resume() を直接呼び出すのではなく、pipe() の戻り値である宛先ストリームの pause() や resume() を制御することを検討してください。
- 必要であれば、pipe() のオプションで end を false に設定し、ソースストリームの終了が宛先ストリームの終了につながらないようにすることも検討できます。ただし、この場合は宛先ストリームの終了を適切に管理する必要があります。
エラー
pipe() メソッドでソケットのデータを別のストリームに流し込んでいる場合、socket.pause() を呼び出すと、パイプライン全体のデータの流れが一時的に停止する可能性があります。意図せずパイプ先のストリームも停止させてしまうことがあります。

イベントリスナーの登録順序

エラー
'data' イベントリスナーを登録する前に socket.resume() を呼び出してしまうと、pause() されていた期間に受信したデータが 'data' イベントとして発行されない可能性があります。

バッファの肥大化

トラブルシューティング
- pause() する期間をできるだけ短くするように設計してください。
- データの処理が遅延する可能性がある場合は、適切なバックプレッシャーのメカニズム（例えば、書き込み可能な状態を監視するなど）を検討してください。
エラー
pause() している期間が長すぎると、ソケットの内部バッファにデータが蓄積され続け、メモリ使用量が意図せず増加する可能性があります。極端な場合には、OutOfMemoryError を引き起こす可能性もあります。

トラブルシューティング
- ソケットの状態 ('close', 'error') を監視し、ソケットが有効な状態でのみ pause() や resume() を呼び出すようにしてください。
エラー
ソケットがクローズされたり、エラーが発生したりするタイミングで pause() や resume() を呼び出すと、予期せぬエラーが発生する可能性があります。

例1: 受信データの処理速度を制御する

この例では、サーバーがクライアントからデータを受信した際に、処理に時間がかかる場合に socket.pause() で一時的にデータの読み取りを停止し、処理が完了したら socket.resume() で再開します。

const net = require('net');

const server = net.createServer((socket) => {
  console.log('クライアントが接続しました');

  let processing = false; // データ処理中かどうかを示すフラグ

  socket.on('data', (data) => {
    console.log('受信データ:', data.toString());

    if (processing) {
      console.log('現在処理中のため、データ受信を一時停止します');
      socket.pause();
      return;
    }

    processing = true;
    console.log('データ処理を開始します...');

    // 2秒間の処理をシミュレート
    setTimeout(() => {
      console.log('データ処理が完了しました');
      processing = false;
      socket.resume(); // 処理完了後に読み取りを再開
    }, 2000);
  });

  socket.on('end', () => {
    console.log('クライアントが切断しました');
  });

  socket.write('サーバーに接続しました！データを送信してください。\n');
});

server.listen(3000, () => {
  console.log('サーバーがポート3000で起動しました');
});

この例では、サーバーがデータを受信するたびに processing フラグを確認します。処理中の場合は socket.pause() を呼び出し、新しいデータの流入を一時的に防ぎます。setTimeout でシミュレートされた処理が完了すると、フラグを false に戻し、socket.resume() を呼び出してデータの読み取りを再開します。

例2: 手動でデータを読み取る (socket.read())

socket.pause() を使用すると、'data' イベントは発生しなくなります。この状態で socket.read() メソッドを使うと、バッファに溜まっているデータを明示的に読み取ることができます。

const net = require('net');

const server = net.createServer((socket) => {
  console.log('クライアントが接続しました');

  socket.pause(); // 最初は読み取りを停止

  // 1秒後にデータの読み取りを開始
  setTimeout(() => {
    console.log('データの読み取りを開始します');
    socket.resume();

    socket.on('readable', () => {
      let chunk;
      while ((chunk = socket.read()) !== null) {
        console.log('読み取ったデータ:', chunk.toString());
      }
    });

    socket.on('end', () => {
      console.log('クライアントが切断しました');
    });
  }, 1000);

  socket.write('サーバーに接続しました！しばらくしてからデータを送信します。\n');
});

server.listen(3000, () => {
  console.log('サーバーがポート3000で起動しました');
});

この例では、サーバーに接続した直後に socket.pause() を呼び出してデータの自動的な読み取りを停止しています。1秒後、socket.resume() を呼び出して読み取りを再開し、'readable' イベントリスナーの中で socket.read() を使ってバッファにあるデータを読み取っています。'data' イベントの代わりに 'readable' イベントを使用していることに注意してください。

例3: パイプ処理の制御 (簡易的な例)

pipe() はストリーム間のデータフローを簡単に実現できますが、pause() を使うことでその流れを一時的に制御できます。ただし、pipe() されたストリームの pause() は、元のソケットの pause() とは独立して動作することに注意が必要です。

const net = require('net');
const fs = require('fs');

const server = net.createServer((socket) => {
  console.log('クライアントが接続しました');

  const writableStream = fs.createWriteStream('received_data.txt');

  // ソケットのデータをファイルにパイプ
  socket.pipe(writableStream);

  // 特定の条件でソケットからの読み取りを一時停止 (パイプには影響しない)
  setTimeout(() => {
    console.log('5秒経過。ソケットからの読み取りを一時停止します');
    socket.pause();

    // 3秒後に再開
    setTimeout(() => {
      console.log('8秒経過。ソケットからの読み取りを再開します');
      socket.resume();
    }, 3000);
  }, 5000);

  socket.on('end', () => {
    console.log('クライアントが切断しました');
    writableStream.end();
  });
});

server.listen(3000, () => {
  console.log('サーバーがポート3000で起動しました');
});

この例では、クライアントからのデータは pipe() を通して received_data.txt に書き込まれます。同時に、サーバー側では setTimeout を使って5秒後に socket.pause() を呼び出し、さらに3秒後に socket.resume() を呼び出しています。この socket.pause() は、ソケットからの 'data' イベントの発生を制御しますが、既にパイプで繋がれているストリームへのデータの流れには直接的な影響を与えないことに注意してください。パイプされたストリームの制御は、そのストリーム自体の pause()/resume() メソッドで行う必要があります。

バックプレッシャー (Backpressure) の利用

例
利点
明示的に pause() と resume() を呼び出す必要がなく、ストリームAPIが自動的にデータフローを制御してくれます。これにより、より堅牢で予測可能なデータ処理が可能になります。
説明
バックプレッシャーは、データの送り手（プロデューサー）がデータの受け手（コンシューマー）の処理能力に合わせてデータ送信速度を調整する仕組みです。Node.jsのストリームAPIは、このバックプレッシャーをサポートしています。pipe() メソッドを使用する際に、宛先ストリームが書き込みに対応できなくなると、ソースストリームに一時停止の信号が送られ、データ送信が遅延または停止します。

const net = require('net');
const fs = require('fs');

const server = net.createServer((socket) => {
  console.log('クライアントが接続しました');

  const writableStream = fs.createWriteStream('received_data.txt', { highWaterMark: 16 }); // 小さな highWaterMark でバックプレッシャーを発生させやすくする

  // ソケットのデータをファイルにパイプ (バックプレッシャーが働く)
  socket.pipe(writableStream);

  writableStream.on('drain', () => {
    console.log('ファイルへの書き込みが再開されました');
    // 必要であれば、ここでソケットへの書き込みを再開するなどの処理を行う
  });

  socket.on('end', () => {
    console.log('クライアントが切断しました');
    writableStream.end();
  });
});

server.listen(3000, () => {
  console.log('サーバーがポート3000で起動しました');
});

この例では、fs.createWriteStream に highWaterMark オプションを設定することで、内部バッファのサイズを小さくしています。ソケットからパイプされたデータがこのバッファを超えると、書き込みストリームは 'drain' イベントを発行するまで、ソースストリームからのデータの読み取りを一時的に遅らせます。

キューイング (Queueing) の利用

例
欠点
キューが大きくなりすぎるとメモリを圧迫する可能性があるため、適切なサイズ管理が必要です。
利点
データの受信と処理を分離できるため、処理が一時的に遅れてもデータ損失を防ぐことができます。
説明
受信したデータを一時的にキュー（配列など）に保存し、後で必要なタイミングでキューから取り出して処理する方法です。

const net = require('net');

const server = net.createServer((socket) => {
  console.log('クライアントが接続しました');

  const dataQueue = [];
  let processing = false;

  socket.on('data', (data) => {
    console.log('受信データ:', data.toString());
    dataQueue.push(data);
    processQueue();
  });

  function processQueue() {
    if (processing || dataQueue.length === 0) {
      return;
    }

    processing = true;
    const data = dataQueue.shift();
    console.log('キューからデータを取り出して処理:', data.toString());

    // 2秒間の処理をシミュレート
    setTimeout(() => {
      console.log('データ処理完了');
      processing = false;
      processQueue(); // 次のデータを処理
    }, 2000);
  }

  socket.on('end', () => {
    console.log('クライアントが切断しました');
  });

  socket.write('サーバーに接続しました！データを送信してください。\n');
});

server.listen(3000, () => {
  console.log('サーバーがポート3000で起動しました');
});

この例では、受信したデータを dataQueue 配列に追加し、processQueue 関数で順番に処理しています。処理中は processing フラグを立てることで、同時に複数のデータが処理されるのを防いでいます。

非同期処理の制御 (async/await, Promises)

例
利点
より構造化された非同期処理のフローを記述でき、エラーハンドリングも容易になります。
説明
非同期処理を適切に管理することで、データの受信と処理のタイミングを制御し、結果的に pause() と同様の効果を得ることができます。例えば、Promiseが解決するまで次のデータの処理を開始しないようにするなどです。

const net = require('net');

const server = net.createServer(async (socket) => {
  console.log('クライアントが接続しました');

  async function processData(data) {
    console.log('データ処理開始:', data.toString());
    return new Promise((resolve) => {
      setTimeout(() => {
        console.log('データ処理完了:', data.toString());
        resolve();
      }, 2000);
    });
  }

  socket.on('data', async (data) => {
    await processData(data); // 前のデータの処理が完了するまで待つ
  });

  socket.on('end', () => {
    console.log('クライアントが切断しました');
  });

  socket.write('サーバーに接続しました！データを送信してください。\n');
});

server.listen(3000, () => {
  console.log('サーバーがポート3000で起動しました');
});

この例では、processData 関数が Promise を返し、socket.on('data') 内で await を使用しています。これにより、前のデータの処理が完了するまで次の 'data' イベントの処理が開始されず、結果的にデータの流入速度が制御されます。