機械学習システム開発

ビープラウドではデータ分析・機械学習に適性の高いPython言語と関連ライブラリを用いて開発します。Web開発での豊富な経験と蓄積した知見を活かすことで、データの加工や分析、学習モデル作成、予測といった機械学習まわりの開発と、Webシステムでの表示までを一括して開発できます。これにより、高い保守性を確保した一貫した開発を可能にしています。

機械学習とは

機械学習は、ビックデータを用いた反復的な学習をもとに、新たな未知のデータに対して学習したパターンに従って将来を予測する技術です。ビープラウドでは、パーソナライズされた商品推薦(レコメンド)・採用担当者向けの求職者活躍予測システムなど、様々な業種での開発経験があります。

主な使用技術

開発手法 チケット駆動開発、アジャイル開発
OS LinuxmacOSWindows
プログラミング言語 PythonJavaScriptObjective-C
データベース MySQLPostgreSQLRedisMongoDB
インフラ AWSGCPVagrantDockerAnsible
開発ツール GitHubRedmineCircleCI
機械学習関連 NumPySciPypandasscikit-learnMatplotlibPuLP

データ分析・機械学習システム開発事例

電子書籍取次会社向け 流通業務優先度スコアリングシステム開発

AWSpandasscikit-learnMatplotlibJupyter Notebook特徴量エンジニアリングアンサンブル学習

電子書籍取次業務では日々大量の書籍を扱っており、販売登録や承認等行う流通業務に多くの人員と時間をかけています。電子書籍には新刊以外にも後から電子化されたものなど実際には1冊も売れないものが7割を締めています。電子書籍のタイトルなどの特徴量と過去の売上冊数を元に機械学習を行い、流通優先度をスコアとして付与し、この優先度を元に流通業務を行うことで人員コストを平準化するシステムを開発しました。

開発では、PoC実装と実データを使って要件を明確にし、特徴量エンジニアリングによってスコアリングと実際の優先度ができるだけ一致するようにチューニングを実施しました。顧客へのレポートには初期にJupyter NotebookとMatplotlibによる見やすいレポート作成を行い、中盤以降は特徴量やアルゴリズムの変更と結果の確認を試行錯誤し、その結果を管理してレポートの出力を自動化する機械学習フレームワークを作成しました。最終的に確定したアルゴリズムを抜き出してAWS環境に組み込み、スコアを日次で担当者に渡すように実装を行いました。

採用担当者向け 応募者の活躍予測システム開発

AWSDjangopandasNumPyscikit-learnCelery

応募者の採用適性検査の結果から、社内の職種ごとにどのくらい活躍できそうか、離職の可能性がどのくらいあるかを予測するシステムを開発しました。また、似た傾向の社員のリストアップを行い、一覧表示にも対応。傾向を予測するために、社員も同じ適性検査を受けておき、その結果と実際の活躍状況を事前に機械学習させておくことで、応募者の傾向の類似度をもとに判定します。

イベント技術タグ割当

DjangoCeleryMatplotlibpandasMeCabbleach

Connpassで公開されているイベント情報に技術タグ情報を自動的に割り当てる仕組みを作り、運用中のシステムに組み込み。イベント技術タグ情報は、広告配信の最適化や開催イベントの傾向分析に利用している。

運用中のメンテナンスコストを下げたい、既存のサーバーリソースを有効活用したい、運用の一環として傾向を分析する環境が欲しい。等の要求を加味しつつ、既存システムの上で、運用中にデータが自動更新される仕組みを構築した。

外部サービスから情報を取得し、技術タグ情報を最新技術に追従。また手動での管理用にDjango管理画面でのメンテナンスも可能とした。技術タグの各イベントへの割り当て処理は、形態素解析(MeCabを利用)の結果やその他、ドメイン情報を加味し、Celeryを使ってバックグラウンドで非同期実行。イベント技術タグ情報は、広告配信へ活用し、また、Re:dashを利用して、connpassの運用の一環として傾向を分析できる環境を用意した。

商品推薦API開発

AWS-LambdaAuroraLuigiZappaDjangoNumPySciPy協調フィルタリング

アパレルサイト上の推薦枠に表示する商品と特集を、会員一人一人に合わせて決定するAPIを作成。協調フィルタリングモデルを使用。Luigiによる定時バッチによって推薦結果を計算し、Aurora DBに保存。APIGateway-LambdaによるサーバーレスAPIで推薦結果をサイトに返却する。

結婚式場の営業支援ツール作成

scikit-learnMatplotlib線形回帰リッジ回帰

結婚式場の申込数を予測するツール。線形回帰モデル、リッジ回帰モデルを比較検討。過学習があったため前処理によって対策。

履歴書スキル抽出

scikit-learnpandasMeCabTF-IDFMatplotlibNumPy

履歴書に書かれた文章を元に、候補者のスキル有無を判定する mecab, TF-IDFを用いて履歴書をベクトル化し、スキル保持者との類似度を計算してスキル有無を判定

観測衛星の運用最適化

PuLPpandasNumPyMatplotlib

複数の衛星・観測地点・地上局が存在する中で、衛星運用の制約条件・目的関数をモデル化し、最適な運用を求めるプログラムを作成、性能評価を行う。

システム開発のご依頼・ご相談

お問い合わせ