【C++】`std::basic_string::substr`を使いこなそう！文字列操作の達人になるための詳細解説

抽出位置や抽出長が不正な場合は、例外が発生します。
抽出する部分文字列は、開始位置と抽出長を指定することで自由に選択できます。
既存の文字列オブジェクトの一部を抽出し、新しい文字列オブジェクトとして生成します。

構文

std::basic_string::substr(size_type pos, size_type len = npos);

パラメータ

len: 部分文字列の長さを指定します。npos を指定すると、開始位置から末尾まで抽出されます。デフォルト値はnposです。
pos: 部分文字列の開始位置を指定します。文字列の先頭は0、1文字目は1、...とインデックスが付けられます。デフォルト値は0です。

戻り値

抽出した部分文字列を含む新しい std::basic_string オブジェクトを返します。

例

#include <iostream>
#include <string>

int main() {
  std::string str = "Hello, World!";

  // 文字列 "World!" を抽出
  std::string sub1 = str.substr(7, 5);
  std::cout << "sub1: " << sub1 << std::endl; // 出力: sub1: World!

  // 文字列の先頭から3文字を抽出
  std::string sub2 = str.substr(0, 3);
  std::cout << "sub2: " << sub2 << std::endl; // 出力: sub2: Hel

  // 文字列 "Hello" を抽出 (デフォルトの長さ)
  std::string sub3 = str.substr(0);
  std::cout << "sub3: " << sub3 << std::endl; // 出力: sub3: Hello

  return 0;
}

注意点

C++23から、右辺値参照修飾オーバーロードが追加されました。従来のオーバーロードはconst左辺値参照オーバーロードに変更されています。
抽出された部分文字列は、元の文字列とは別のオブジェクトとして扱われます。元の文字列を変更しても、抽出された部分文字列は影響を受けません。
抽出位置や抽出長が不正な場合、プログラムが異常終了する可能性があります。

文字列を加工して新しい文字列を生成したい場合
文字列の一部を切り取って別の文字列に挿入したい場合
長い文字列から特定の部分だけを処理したい場合

特定の部分文字列を抽出

#include <iostream>
#include <string>

int main() {
  std::string str = "The quick brown fox jumps over the lazy dog.";

  // "fox" という部分文字列を抽出
  std::string sub1 = str.substr(16, 3);
  std::cout << "sub1: " << sub1 << std::endl; // 出力: sub1: fox

  // "jumps over the" という部分文字列を抽出
  std::string sub2 = str.substr(19, 14);
  std::cout << "sub2: " << sub2 << std::endl; // 出力: sub2: jumps over the

  return 0;
}

文字列の一部を切り取って別の文字列に挿入

#include <iostream>
#include <string>

int main() {
  std::string str1 = "Hello";
  std::string str2 = "World";

  // "Hello" の後ろに "World" を挿入
  str1.insert(5, str2);
  std::cout << "str1: " << str1 << std::endl; // 出力: str1: HelloWorld

  return 0;
}

#include <iostream>
#include <string>

int main() {
  std::string str = "This is an example string.";

  // 小文字に変換して新しい文字列を生成
  std::string lower = str.substr(0).substr(0, str.size() - 1);
  lower.transform(lower.begin(), lower.end(), ::tolower);
  std::cout << "lower: " << lower << std::endl; // 出力: lower: this is an example string

  // 先頭と末尾の空白を除去して新しい文字列を生成
  std::string trimmed = str.substr(1, str.size() - 2);
  trimmed.erase(trimmed.begin(), std::find_if(trimmed.begin(), trimmed.end(), [](char c){ return std::isspace(c); }));
  trimmed.erase(std::find_if(trimmed.rbegin(), trimmed.rend(), [](char c){ return std::isspace(c); }));
  std::cout << "trimmed: " << trimmed << std::endl; // 出力: trimmed: This is an example string

  return 0;
}

文字列リテラル

例：
比較的単純な部分文字列の抽出であれば、文字列リテラルを使用する方が簡潔で分かりやすいコードになります。

std::string str = "Hello, World!";
std::string sub = "World!"; // 文字列リテラルによる部分文字列

// ...

std::cout << sub << std::endl; // 出力: World!

利点

コンパイル時に部分文字列が確定するため、パフォーマンスが向上する場合がある
簡潔で分かりやすいコード

欠点

コードが冗長になる可能性がある
複雑な抽出条件には対応できない

範囲ベース for ループ

例：
文字列全体を反復処理し、必要な部分文字列を抽出する場合に有効です。

std::string str = "Hello, World!";
std::string sub;

// "World!" 部分文字列を抽出
for (size_t i = 7; i < str.size(); ++i) {
  sub += str[i];
}

// ...

std::cout << sub << std::endl; // 出力: World!

利点

可読性の高いコードになる
柔軟な抽出条件に対応できる

欠点

std::basic_string::substr よりも処理速度が遅い場合がある

C 言語ライブラリ関数

例：
strncpy や strtok などの C 言語ライブラリ関数を使用することもできますが、C++ 標準ライブラリよりも安全性や可読性が劣る場合があるため、注意が必要です。

#include <cstring>

std::string str = "Hello, World!";
char sub[6];

// "World!" 部分文字列を抽出
strncpy(sub, str.c_str() + 7, 5);
sub[5] = '\0';

// ...

std::cout << sub << std::endl; // 出力: World!

利点

処理速度が速い場合がある

欠点

C++ 標準ライブラリとの互換性に注意が必要
安全性や可読性が低い

正規表現

例：
正規表現ライブラリを使用すれば、より複雑な抽出条件にも対応できますが、コードが煩雑になる可能性があります。

#include <regex>

std::string str = "Hello, World!";
std::string sub;

// "World!" 部分文字列を抽出
std::regex re("(\\w+)$");
std::smatch match;

if (std::regex_search(str, match, re)) {
  sub = match[1].str();
}

// ...

std::cout << sub << std::endl; // 出力: World!

利点

非常に複雑な抽出条件にも対応できる

欠点

正規表現ライブラリの習得が必要
コードが煩雑になる可能性がある

Boost.String や C++ Essentials などのライブラリには、std::basic_string::substr の代替となる関数や、より高度な文字列操作機能が提供されている場合があります。

最適な代替方法の選択

ライブラリの習得コスト
コードの可読性
処理速度
抽出条件の複雑さ

などを考慮して、最適な代替方法を選択する必要があります。

std::stringはもう古い？C++における次世代文字列操作ツールstd::basic_string_view

本記事では、std::basic_string_view における主要な演算子とその使用方法について分かりやすく解説します。std::basic_string_view は、文字列の比較に使用できる以下の比較演算子を備えています。>=: 大なりまたは等価比較。1つの std::basic_string_view オブジェクトが別のオブジェクトよりも文字列として大きいか、または等しいかどうかを検査します。

C++ Strings: operator<<(std::basic_string_view) のサンプルコード

operator<<(std::basic_string_view) は、C++ の標準ライブラリにおける std::basic_string_view クラス専用の挿入ストリーム演算子です。この演算子は、std::basic_string_view オブジェクトの内容をフォーマットされた文字列として出力ストリームに挿入するために使用されます。

C++プログラミング：ファイルパス、文章、DNA配列から最後の出現箇所を検索！「std::basic_string_view::rfind」の使い方

std::basic_string_view::rfindは、C++標準ライブラリに含まれる関数で、指定された文字列または文字が、参照している文字列ビュー内に最後に出現する位置を検索します。構文パラメータpos: 検索を開始する位置 (デフォルト: npos (最後まで検索))

【初心者向け】C++の「Strings」でstd::basic_string_view::sizeを使いこなす

std::basic_string_view::size 関数は、保持している文字列の長さを size_type 型の値として返します。size_type 型は、符号なし整数型であり、文字列の長さを表現するために十分な大きさを持つように設計されています。

C++プログラミングの基礎固め：Null文字バイト文字列とstd::vectorで文字列操作を習得

文字列の終端には必ずヌル文字が置かれ、文字列の長さはヌル文字までのバイト数で決まります。ヌル文字は、ASCIIコード0に対応するバイト値'\0'です。各バイトは、1文字分のデータを保持します。文字列は、連続したメモリ領域に格納された一連のバイトとして表現されます。

C++で`std::string`を数値に変換するテクニック：`std::atof` 関数を超えた方法とは

変換に失敗した場合は、0.0 を返します。変換に成功した場合は、変換された浮動小数点数値を返します。浮動小数点リテラル、指数表記、科学的記数法を含む、様々な形式の文字列を受け付けます。文字列 str を解析し、それに含まれる浮動小数点数値を double 型に変換します。

【C++チュートリアル】`std::atoll`関数を使って文字列を符号付き整数に変換する方法

パラメータstr: 変換する文字列へのポインタ戻り値変換に失敗した場合は、0変換に成功した場合は、変換された long long int 型の値例この例では、str 配列は "123456789" という文字列を格納しています。std::atoll 関数は str に渡され、文字列を long long int 型の値 123456789 に変換します。この値は std::cout を使用してコンソールに出力されます。

C++ std::isspace 活用術：文字列トリム・単語カウントの具体例

std::isspace は、C++標準ライブラリの <cctype> ヘッダ（C言語の <ctype. h> に対応）で定義されている関数です。この関数は、与えられた文字が「空白文字（whitespace character）」であるかどうかを判定するために使用されます。

std::memcmp vs. std::strcmp/std::string：C++での文字列比較を徹底比較

std::memcmp は、指定されたバイト数だけ、2つのメモリブロックをバイナリ的に（バイトごとに）比較する関数です。これは、特定のデータ型に依存せず、生のメモリ内容を比較する際に非常に便利です。std::memcmp を使用するには、以下のヘッダーファイルをインクルードする必要があります。

もう迷わない！C++ std::strerrorの一般的なエラーとトラブルシューティング

以下に std::strerror について詳しく説明します。シグネチャ: char* strerror(int errnum); errnum: エラーコードを指定する整数値。通常は、直前のシステムコールやライブラリ関数の失敗時に設定されるグローバル変数 errno の値を使用します。戻り値: エラーメッセージを表すヌル終端文字列へのポインタを返します。このポインタが指す文字列は、プログラムによって変更してはなりません。また、strerror の後続の呼び出しによって上書きされる可能性があります。