4年で発行枚数1000万枚超のPayPayカードが明かす、急成長を支える基幹システム「フルクラウド化」への挑戦と苦労:「プラットフォームエンジニアリング」に注力する理由とは
2025年6月4〜5日に開催された「@IT 開発変革セミナー 2025 Spring」の基調講演で、PayPayカードの岡元秀憲氏が登壇。2023年に基幹システムのクラウド移行を果たし、現在はクラウドネイティブな取り組みとともに、「基幹システムのフルクラウド化」に向けて取り組んでいるという同社のクラウド戦略や、クラウド移行における苦労、クラウドネイティブ実践のリアルを講演した。
ITサービスの開発と運用がビジネス展開と同義となる今、ニーズへのスピーディーな対応と、安定運用の両立が求められている。その実現に向けたアプローチとして、パブリッククラウドの活用が進んできた。近年では、基幹システムを含む既存システムをクラウドに移行させる動きも広まりつつあるが、多くの企業にとっては、既存システムの複雑さやコストといった課題が移行の大きな壁となっている。
では、先行するテクノロジー企業は、クラウド活用を通じて事業の成長を加速させ、ビジネス価値を高めるために、どう移行を実現させているのか。クラウド移行において課題とどのように向き合ってきたのか。
2025年6月に開催された「@IT 開発変革セミナー 2025 Spring」の基調講演に登壇したPayPayカードの岡元秀憲氏(テクノロジー統括本部 決済プロダクト本部 イシュイングサービス開発部 部長)が、「基幹システムのフルクラウド化」の実現に向け、同社が進めてきたクラウド戦略や移行における苦労、クラウドネイティブ実践のリアルを講演した。本稿ではその講演内容を要約してお伝えする。
ユーザー数6900万人のPayPayグループで、金融サービスを展開
登録ユーザー数6900万人(2025年6月時点)に上るPayPayグループでクレジット機能を中心としたサービスを提供するPayPayカード。有効カード発行枚数は1400万枚に達し、預金口座数900万口座のPayPay銀行、証券口座数137万口座のPayPay証券とグループによるシナジーを強みに、次世代の金融サービス開発を続けている。
同社は、「PayPayカード」「PayPayカード ゴールド」を発行しており、「PayPayアプリ」と連携させることで、スマートフォンアプリで一元管理できることが特徴だ。2025年5月には新サービスとして、バーチャルカード「PayPay残高カード」を提供し、GooglePayとのアカウント連携を発表するなど、サービスの継続的な改善に取り組んでいる。また、カード券面へのカード番号の印字をなくし、海外からの利用制限やオンライン利用の制限もユーザー側で可能にするなど、利用者に安心/安全を提供するための取り組みも実施してきた。
「2021年12月にPayPayカードを発行開始し、プロダクトを磨き込み、新しいサービスを提供し続けることで、多くのユーザーに利用していただき、発行枚数や取扱高が大きく伸び、急成長しています。数年後には、数倍の会員獲得、取扱高増加を目指しています」
岡元氏によると、金融事業を展開する上で、サービスの安定的な提供と変化への迅速な対応は非常に重要だとする。そこで同社は、クラウドの採用とクラウドネイティブなシステムに変化していくことを重要な戦略と位置付けている。
「当初は、基幹システムをオンプレミスで更改する計画でしたが、『PayPayカード発行』を受け、2020年にクラウド移行する方針に変更しました。カード発行開始後の2023年にクラウド移行を果たし、2025年現在は、クラウドネイティブの推進に向けて取り組んでいます」
2020年からPayPayカードの発行に向けてクラウド移行に取り組む
クラウド移行前時点で、基幹システムを中心にさまざまな機能や業務に対応する周辺システムがあり、その規模感はデータ量約10TB、データ件数(レコード総数)が約150億レコード、バッチ処理数が1万8000本/日、約3万4000本/月になっていたという。
そんな中、同社が基幹システムのクラウド移行を決めた最大の理由は、事業の急成長/拡大計画にあった。
「マーケティング施策やキャッシュレス決済の拡大など、ビジネスの変化が激しい中、その都度システムを対応させる必要がありました。クラウドは、負荷予測に基づいて設備投資する必要がなく、必要な時に必要な分だけリソースを確保できます。また、大規模キャンペーンを実施する際の一時的な増強や、計画の見直しに伴うシステム変更にも柔軟に対応できます。初期投資を抑えつつ、将来の成長に合わせてスケールできるという柔軟性/拡張性に優れている点が、基幹システムのクラウド移行を決めた大きな理由の一つです」
クラウドにはAmazon Web Services(AWS)を採用している。PayPayグループ内でもAWSを利用しており、グループ内でノウハウを共有できることが背景にあった。
「事業会社であるわれわれは、プロダクト開発に注力したいと考えていました。プロダクトをスピーディーに構築するには、AI(人工知能)や機械学習など最新の技術も不可欠です。また、IaC(Infrastructure as Code)を利用することで、手作業での構築ミスや設計とのズレなどがなくなり、再現性のある構築管理が可能になります。マネージドサービスを利用することで運用作業を減らすこともできます。私たちはクラウド移行を推進する上で、AWSが提唱する『7つのR』という移行戦略を参考にしました」
移行戦略を選択するに当たって、現状のシステムのアセスメントや移行に向けての組織体制などの見直しにも取り組んだという。そして、アセスメントの結果、2つのステップで移行することを決めた。
「システムをいきなりクラウドネイティブに作り変えるのは膨大な工数がかかると分かり、まずは、クラウドのメリットを最大限に活用し、社内におけるクラウド利用への理解とノウハウを蓄積するために『リホスト』や『リプラットフォーム』を実施し、クラウド移行することを決めました。その経験と基盤を生かし『リファクタリング』や『リアーキテクト』を行い、クラウドネイティブなシステムへの本格移行を進めることにしました」
基幹システムのクラウド移行プロジェクトで直面した3つの課題
だが、クラウド移行に当たって大きく分けて3つの課題に直面した。
1つ目は、システムの性能問題だ。高可用性を実現するため「Amazon Relational Database Service」(Amazon RDS)を利用し、バッチサーバはマルチAZ(Availability Zone)の構成で当初検討していたが、性能試験を実施する中でレイテンシが大きな課題となったという。
「ある機能のテスト結果として、シングルAZで0.19ミリ秒、マルチAZで2.6ミリ秒というレイテンシが確認できました。1000万件のデータを扱う場合、実行時間が10倍近い差となってしまうため、大量データをバッチ処理するという観点で考えた際に大きな課題となりました」
そのため、シングルAZ構成を選択し、性能要件をクリアした。また、アクティブスタンバイ構成にし、障害時には即座に切り替えられる仕組みを構築することで、「クラウドネイティブとはいえないものの、可用性の確保を実現した」という。
2つ目は、品質課題だ。移行プロジェクトは重大なバグが判明して複数回にわたってリリースを延伸していた。また、有識者が不足しており、品質チェックが十分にできていないという課題もあった。そこで、経営判断として、機能や事業移行の廃止を決定したという。結果として、シンプルな仕様になることで開発の難易度が下がり、品質をコントロールできるようになった。
3つ目は、体制の課題だ。ベンダー依存で開発をしていた体制を、社員を中心とした内製化を推進する体制に変更した。内容は、採用の強化から契約の見直し、プロジェクト管理の方法など多岐にわたった。体制変更前までは、ベンダー任せやゴールが不明瞭な状態で、課題の解決に時間がかかっていた。変更後は、一人一人が責任を持って課題の解決や意思決定を行い、プロジェクトを進められるようになった。
「数百人が関わる大規模なプロジェクトであり、内製化を進める一方で、ベンダーとも丁寧なコミュニケーションを行い、一丸となってリリースに向けて進めました。この時の内製化の推進があったからこそ、社内にノウハウが蓄積され、より開発スピードを上げられるようになりました。これはクラウド移行を成功に導いた最大の要因だったと考えます」
クラウド移行のメリットと移行後の課題
クラウド移行後はさまざまな効果を確認できた一方で、新たな課題にも直面した。クラウド移行で発生したメリットと課題はそれぞれ2つずつに整理できるという。
クラウド移行のメリット
柔軟なサーバリソースの利用
クラウド移行におけるメリットの一つは、柔軟なサーバリソースの利用だ。
「クラウド移行プロジェクト自体に多くの開発リソースを割いており、移行完了後は開発案件が山のようにあり、幾つもの案件を並走させる必要がありました。オンプレミス時代はテスト環境の競合により、順番を待つか合間を縫って調整するなど、リードタイムがかかっていましたが、クラウド移行により、案件ごとに必要な分だけ環境を構築し、並行して各工程を実施できます。これにより、開発やテストのリードタイムを大幅に短縮できました」
最新技術の利用
もう一つのメリットは、最新技術の利用だ。例えば、ユーザーからの問い合わせに対して生成AIで回答するサービスを開発できたという。
「『Amazon Bedrock』を利用しているため、生成AIの環境構築や管理が不要で、モデル検証や変更が容易にできました。誤った情報を回答してしまうと法的な問題にもなるため、RAG(検索拡張生成)を採用し、Amazon Simple Storage Service(Amazon S3)を組み合わせて、誤った情報、ハルシネーションを出さないようにしています」
クラウド移行後の課題
クラウドのコスト
クラウド移行プロジェクトは予算や工期が限られる中で100%の状態でリリースできたわけではなく、クラウド移行に伴う課題も生じていた。その課題の一つが、そもそもクラウドコストが高く、改善が必要だった点だ。
「事業成長の指標の一つである『カード利用のトランザクションを母数とした1トランザクション当たりのコスト』をKPI(重要業績評価指標)として管理するようにしました。また、『FinOps』の取り組みとして専任チームを作り、不要なデータ削除、土日夜間のシステム自動停止など、基本的なことを含めて、さまざまな改善に取り組みました。その結果、事業成長に伴いトランザクション数が増加する一方で、右肩下がりでコストを適正化できました。ただ、開発者との連携やアラートの仕組み、リソースの最適化など、まだまだやるべきことがあり、継続して実施しています」
性能の課題
クラウド移行に伴う課題の2つ目は、データベースの性能課題だ。先述したように、移行前にも性能試験を実施していたものの、機能拡張や会員数、取扱高の増加に伴い、新たに性能面での課題が発生したという。特に懸念されたのがデータベースI/O(Input/Output)のボトルネックだ。
「データベースのIOPS(Input/Output Operations Per Second)は上限値まで利用していたため、よりIOPSが高いタイプのデータベースに変更しました。こちらはダウンタイムを伴うものでしたが、夜間に数時間で変更できました。また、IOPSの上限値の拡大にも取り組みました。コンソール上で簡単な操作のみでユーザーに影響せず2カ月半ほどで対応できました。大規模なシステムの性能課題に対して、迅速かつ低リスクで対応できることは、クラウド移行による非常に大きなメリットの一つです」
「プラットフォームエンジニアリング」を推進 その理由とは
また現在は、それぞれのシステムがCI/CD(継続的インテグレーション/継続的デリバリー)や監視、コード管理などの仕組みを独自に構築/管理しているため、同じ機能やツールが散在し、コスト課題が生じているという。システムごとにアーキテクチャや利用する技術を検討し、実装しているため、取り組みが重複しており「車輪の再発明」状態につながっている。そこで取り組んでいるのが、「プラットフォームエンジニアリング」だ。
「再利用可能な共通のツール、サービスをプラットフォーム部門が提供し、アプリケーション開発者は、開発に集中できる環境を目指す、プラットフォームエンジニアリングの取り組みを推進しています」
具体的には、マイクロサービス化されたアプリケーションをデプロイするための共通CI/CDパイプライン、実行環境、リアルタイムなバッチ処理を実現させるキューの仕組みや、メトリクス監視、リアルタイムで確認可能なログ基盤の仕組みをクラウドネイティブに整備している。
「共通プラットフォームにより、2つの効果を期待しています。1つ目は、ツールや機能が共通化されることで、インフラコストを削減すること。システムごとに策定していたパイプライン、システム間通信費、各種ソフトウェア費を削減できると期待しています。2つ目は、開発者が共通化された基盤の上で開発に集中できるため、生産性が向上し、最終的にはリリース数が向上すると考えています」
今後は並行して、オンプレミスサーバのさらなる削減、最終的にはフルクラウド化を目指している。
「単にクラウド移行するだけでなく、クラウドのメリットを最大限に生かすクラウドネイティブを実践し、ビジネスの変化に柔軟かつ迅速に対応できるシステムを実現していくことが目標です。日本で圧倒的なスタンダードとなるキャッシュレスサービスを提供していきます」
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「コード化できない課題をLLMで解く」 LayerX松本氏が語る、AIエージェント時代のプロダクト開発の在り方、LLMを生かすための前提条件
2025年6月4〜5日に開催された@IT 開発変革セミナー 2025 Springの基調講演で、LayerX 代表取締役CTOの松本勇気氏が登壇。AIエージェント時代のプロダクト開発の在り方や、LLMを生かすための前提条件を講演で解説した。Kubernetesの本番運用が8割の今、セキュリティが最大の課題だったクラウドネイティブ活用はどう変化した?
Cloud Native Computing Foundation(CNCF)は、クラウドネイティブ技術の導入状況に関する12回目の年次調査の結果をまとめたレポート「Cloud Native 2024」を発表した。「Platform Engineering」は何を解決するのか? 誰が何をするものなのか?
Gartnerが紹介し、海外で広まりつつある「Platform Engineering」とはどのようなものなのか。誰がどう取り組めばよいのか。2023年3月に開催された「Platform Engineering Meetup #1」に登壇したHashiCorp Japanの草間一人氏とサイバーエージェントの青山真也氏のセッション内容を要約してお伝えする。