コンテンツへスキップ

記事

金融データ活用推進協会主催のMeet-Upに参加しました!

アイティーシーが特別会員として参画している、金融データ活用推進協会(FDUA)主催の「金融業界若手データサイエンティストMeet-Up(2022年7月26日開催)」に参加しました!
詳細はこちら

本イベントは、データサイエンス歴が浅い若手人材が相互にレベルアップを図る機会を創設し、金融業界全体でのデータ活用の水準を向上させることを目的としています。

~イベントに参加してみた感想~
今回は初回ということで、各参加者の自己紹介と今後のイベントでやりたいことについて意見を出し合いました。イベント名のとおり、金融業界の若手データサイエンティストが集まったわけですが、取り組んでいる内容は多種多様、いずれも興味深いもので、とても刺激になりました。

今後も協会の活動情報を更新していくのでお楽しみに!

金融データ活用推進協会HPはこちら

関連記事
一社)金融データ活用推進協会にアイティーシー加盟
一社)金融データ活用推進協会加盟の目的
金融データ活用推進協会(FDUA)が日本経済新聞に取り上げられました!

金融データ活用推進協会が日本経済新聞に取り上げられました!

アイティーシーが特別会員として参画している、金融データ活用推進協会(FDUA)が、日本経済新聞に取り上げられました!対象の記事はこちら

協会の目的は大きく3つあります。
(1)金融機関のAI・データ活用推進のためのデザインパターンの作成
(2)金融業界内・関係諸団体等との情報交換や連携
(3)金融データの魅力を発信するデータ分析コンペティションの開催、運営
特に、日経新聞でも取り上げられた、(1)金融機関のAI・データ活用推進のためのデザインパターンの作成活動は、ITCメンバーも積極的に参加しています。

協会の活動情報も随時更新していくのでお楽しみに!

金融データ活用推進協会HPはこちら

関連記事
一社)金融データ活用推進協会にアイティーシー加盟
一社)金融データ活用推進協会加盟の目的

AIセミナー 1dayインターンシップ 日程追加のおしらせ

2024年度新卒向けインターンシップの日程を追加しました。
ご興味のある方は、ぜひご応募ください!
開催日 ①8/26 ②9/27 ③10/27 のいずれか
実施場所詳細 オンライン開催
募集人数 20名程度
なお、最小実施人数は5名以上です
資格・対象 2024年3月に4年制大学・大学院卒業予定の方および2024年4月までに入社可能な方
※文系理系不問
エントリー方法 リクナビ2024からエントリー

または、会社HP(https://www.itccorp.co.jp/entry.html)からエントリー
※お問い合わせ内容欄に、「インターンシップ参加希望」および参加希望日程を記入。

準備物および服装 ・パソコン(スマホ、タブレット可)
動画をご視聴頂きますのである程度の通信帯域が必要です
・筆記用具
・服装は自由です

 

Kaggle活動記録-1

こんにちは。アイティーシー DA事業部の岡です。

Kaggle活動記録では、岡が参加したKaggleコンペティションの内容と、実績について詳しく書いていきます。
※本記事は、機械学習を勉強し始めた方や、これからKaggle等のコンペティションサイトに参加しようとされている方向けの記事です。以降で出現する専門用語について、1つひとつの説明を割愛しているので、何卒ご容赦ください。

Kaggleについて
皆さま、Kaggleについてご存じでしょうか?
Kaggle(サイト)は、企業や研究者がデータやコードを投稿・共有し、世界中のデータサイエンティストがその最適モデルを競い合うプラットフォームサイトです。https://www.kaggle.com/
Kaggle社はGoogle傘下の、予想モデリングおよび分析手法関連プラットフォームを提供している企業です。

今回ご紹介するコンペティション
Tabular Playground Series-6月版
「Tabular Playground Series」は、他のコンペティションと比較し、参加しやすい初心者向けのコンペティションです。
~Tabular Playground Series 参加しやすいポイント~
◎学習/分析対象データは、表形式のデータで、ほとんどの場合、データファイルは1種類のみです。
◎ほとんどのSeriesのデータで、提供されるデータに欠損値は存在しません。
◎コンペティションで競う評価指標はメジャーなものが多く分かりやすいです。
正答率や絶対平均誤差がよく使用される評価指標になります。

コンペティション内容詳細
上記『参加しやすいポイント』で記載した内容とは相反しますが、6月版コンペティションは、欠損値が多く存在するデータ群が提供され、これ(欠損値)を予測/補完するモデルを作成、精度を競い合う、という内容でした。評価指標はRMSE(二乗平均平方根誤差)で、RMSEが小さいほど精度が高いモデル(予測)である、と評価されます。

予測値算出までの主な流れ
Tabular Playground Seriesで、予測値を提出するまでの”個人的な”作業の流れは決まっていて、以下のようになります。
データ状態の確認(EDA)
・・
学習データの準備
・・
モデルの構築(学習)
・・
精度評価
・・
提出用データ作成
この流れに沿って、実際にモデル構築を行ったソースコード、フェーズ毎の詳細な説明などは以下Kaggleページで公開しています。ご興味があれば、是非ご覧ください。
https://www.kaggle.com/code/imnaho/tps-jun22-eda-predict

考察
今回のコンペティションは、個人的にはとても納得できる結果が出ました。
今回の分析対象のデータは、ID列を除いた80列、1000000行のデータ群でしたが、データ状態を確認したところ、単相関で相関が強い列と相関がほぼ0なデータ列が極端に分かれていることが分かりました。

(↑公開コードより単相関のheatmap画像を抜粋。黒色箇所が相関ほぼ0です。↑)
このことから、特に相関が強い列については回帰やランダムフォレストなど、数値予測としてポピュラーなアルゴリズムを利用することで、精度が高くなることが予想できますし、逆に相関ほぼ0な列については他の列はあまり気にせず、単純な平均値や中央値により補完する方が良いのではないか?と予想することができます。
上記URLで記載している公開コードでは、補完が必要な列に対し、列ごとに複数のアルゴリズムで学習させ、精度を評価しています。
具体的には、欠損値が存在しているデータ列数が55列、選定したアルゴリズムが4種類+単純な中央値補完1種類で精度を評価したため、学習と評価(RMSEの計算)は55×5=275回行っています。
結果は想定通り、相関が高い列は数値予測アルゴリズムで精密(精密さはパラメータで指定します)に予想した方が精度が高く、相関がほぼ0な列では時間をかけて学習したモデルより、単純な列毎の中央値の値の方が精度が良い、もしくはほぼ変わりなしという結果になりました。
実際にデータ補完を依頼される場合には、これで終わりではなく、結果をレポートにまとめ、特に相関が0に近いデータ列について、お客様によくよくヒアリングを行い、相関が0になる理由や、データ自体が間違っている可能性がないか、相関が高くなる可能性があるデータを追加できないか等、追加検討し、より精度の高いモデルの構築を目指します。
ともあれ、仮説がぴったり当たっているととても気持ちがいいものです。
データ状態の確認から、仮説、仮説検証の道筋を綺麗に書けたのと、これに沿って構築したモデルの予測値スコアが上場の結果だったため、公開したNotebookに対しシルバーを獲得することができました。upvoteいただいた方に感謝です。

今後もKaggle活動記録を追加していきますのでお楽しみに!

————————————————–
自己紹介
所属:株式会社アイティーシー データアナリティクス事業部
経歴:約6年間、SEとして基幹システムの運用保守、開発を担当していました。
データサイエンティストへのキャリアチェンジを試み、日々奮闘中です。
Kaggleアカウントページはこちら:https://www.kaggle.com/imnaho
LinkedInページはこちら:https://www.linkedin.com/in/naho-oka-9ba89322b/

一社)金融データ活用推進協会加盟の目的

一般社団法人金融データ活用推進協会(略称 FDUA )が6月22日の発足と同時に株式会社アイティーシー(ITC)も特別会員として加盟しました。

FDUAの主な活動内容は、
(1)金融機関のAI・データ活用推進のためのデザインパターンの作成
(2)金融業界内・関係諸団体等との情報交換や連携
(3)金融データの魅力を発信するデータ分析コンペティションの開催、運営
です。

FDUAが掲げるミッションのひとつに「地方創生」があります。
当社も地方創生を目指して活動を続けております。
趣意が一致するため、当社も特別会員として加盟いたしました。
当社はFDUAへの加盟を通じて、大手金融機関やデータ分析・AI開発のトップ企業と切磋琢磨し、最先端の情報やそれらの技術を共有および活用することで、より多くの企業にデータ分析・AIの魅力を発信し参ります。
それと並行して、岡山に最先端のデータ利活用・AI開発のノウハウを持ち帰り、企業各社がデータ活用・AIをリーズナブルに早期導入出来るようにすることで、地方の人手不足解消につなげたいと考えております。

また、地方大学でのデータ分析コンペティション開催等を通じて、地方でのデータサイエンス人材育成を盛り上げ、リスキリングすることで、企業ニーズに即した実践的なDX人材を増やし、地方活性化・地方創生に少しでも貢献できるように努力して参ります。

一社)金融データ活用推進協会にアイティーシー加盟

株式会社アイティーシーは、金融機関とAIスタートアップ社で発足された、一般社団法人金融データ活用推進協会(FDUA)に特別会員として加盟しました。

FDUAのHPはこちら↓
FDUA | 金融データで人と組織の可能性をアップデートしよう

本協会は、金融業界におけるデータ活用を推進する横断的組織であり、金融機関の実務目線に立ち、AI・データ活用の推進、業界・各社の発展、および個人のキャリアアップの貢献を目的としています。

理事会員
 
一般会員

     
特別会員一覧

【協会の主な活動】

(1)金融機関のAI・データ活用推進のためのデザインパターンの作成
(2)金融業界内・関係諸団体等との情報交換や連携
(3)金融データの魅力を発信するデータ分析コンペティションの開催、運営

アイティーシーでは、これらの活動に参画し、金融業界における最先端情報や技術に触れることで、お客様により良いAI開発・データ分析のご提案ができるようになることを目指します!

AIセミナー 1dayインターンシップ開催 – 2024年度

1Dayインターンシップを開催いたします。

データ分析・AI開発事業は、当社のビジネス分野の一つです。
今回の1day仕事体験では、当社が取り組んできたデータ利活用の事例をもとに、データ分析・AIの業務を学ぶことができます。
また、従来型ITから先端IT(データ分析・AI)へと激変するIT市場構造の変化もお伝えします。

職種:データサイエンティスト、システムエンジニア

対象:2024年3月大学卒/大学院了、2024年4月までに入社可能な方

AIセミナー

~ 夏季(7月、8月) 入門コース 概要 ~

☆インフラ評価システム(当社事例)から学ぶデータ分析・AI 開発
「課題」、「データ」、「ニューラルネットワークの使い方」、「可視化」、「実装」

☆AI 開発の手法を学ぶ

☆ 従来型ソフトウェアとデータ分析・AIの違い

    • 従来型ソフトウェアは効率化、データ分析・AIはベネフィット
    • ビジネスモデルを変革するデータ利活用(データ分析・AI)
    • AI開発でプラットフォーマー環境が使える場合、独自環境を構築する場合

☆ IT市場の構造の変化を知る

    • 先端ITと従来型IT
      2027年頃には市場構造が従来型ITから先端ITに逆転します
      市場構造の変化に伴い技術者もスキルの転換が必要になります
      一朝一夕には難しく当社は2015年から先端IT技術を蓄積して参りました

☆ データ分析・AIに必要な知識と人材

    • AIに必要な3つの力と開発手法を知る

☆ディスカッションとまとめ

■予定時間 10時~15時 (昼休憩1時間、途中の小休憩)

~ 冬季(11月、12月) 実践コース 予定 ~

    • 冬季実施内容は、夏季入門コースを深掘りして、より実践的な内容を計画しております。
      したがって、夏季参加者の方を対象とさせていただきます。
    • 冬季にはじめて参加される方は入門コースを別途ご用意します。

 

開催日 ①7/28 ②8/26 のどちらかを選択
実施場所詳細 オンライン開催
募集人数 20名程度
なお、最小実施人数は5名以上です
資格・対象 2024年3月に4年制大学・大学院卒業予定の方および2024年4月までに入社可能な方
※文系理系不問
エントリー方法 リクナビ2024からエントリー
準備物および服装 ・パソコン(スマホ、タブレット可)
動画をご視聴頂きますのである程度の通信帯域が必要です
・筆記用具
・服装は自由です

 

■□■□■皆さまのご応募をお待ちしております■□■□■

2022年度新入社員研修レポート

4月からの2ヶ月間、OFF-JT環境での研修をおこないました。
研修内容は以下の通りです。その概要についてお伝えします。

①社会人基礎力研修
②PG/SE基礎研修
③DA事業部研修
④開発課題演習

受講生レポート

教育学部出身/F.S
2022年4月入社

1.研修内容

①社会人基礎力研修
社会人基礎研修では、社会人と学生の違いや服装・心遣いなどの社会人としての心構え、社会のマナー・ルールについて講義を受けた。
また、電話応対やビジネスメールの書き方といった実務的な研修も行った。

②PG/SE基礎研修
PG/SE基礎演習では、市販教材を用いたJavaのコーディングやオブジェクト指向についての学習、MySQLやHTML、CSSの文法の習得、業務に欠かせない基本設計書の書き方、Springフレームワークを用いたDB接続やログインなどの簡易システムの単体での作成を行った。

③DA事業部研修
DA事業部研修では、機械学習やデータ分析、AI開発の契約方式についての講義を受け、AIや機械学習、ニューラルネットワークといったデータ分析に欠かせないものについて学習した。

④開発課題演習
開発課題演習では、PG/SE研修で学んだ知識や技術を用いて社内用の簡易的な業務日報システムの開発を行った。このシステムには、ログイン、ユーザの登録・修正・削除などのアカウント管理機能、日報の作成、登録、検索の機能を実装した。

 

2.所見

上記の研修の中で最も力がついたと実感したのは、開発課題演習であった。
PG/SE研修で学んだ知識を活用し、複数機能を持つプログラムを作成する過程は、サンプルコードなどはもちろん存在せず、自らの力で調べ、考える必要があった。
このことにより、コードの一つ一つについてどのような意味を持っているのかを考えることができた。

また、このシステム開発では、本来の業務とは順番が前後するものの基本設計書やテスト仕様書の作成も行ったため、実際の業務に近い形式で研修を進めることができた。
最終的には、完全ではないもののローカル環境で動くシステムを完成させることができ、この仕事についてのやりがいや達成感を味わうこともできた。

DA事業部研修についても、大変興味深い内容であった。AIについてはメディア等でも大きく取り上げられているため、言葉としては認知していたが、実際にどのような仕組みで機能しているかについては無知であった。
この研修では、実務経験がない初学者でも簡単に理解できるようにカリキュラムが組まれており、大変理解しやすいもであった。
また、今後のIT業界に関する動向についても話があり、当社がAIを重視する理由についても理解することができた。

3.まとめ

私は大学でプログラミングに関する学習を一切行っていない。
そのため、入社するにあたって、業務を遂行できるのか不安を抱いていた。
結果として、2ヶ月のOFF-JTを通してこの不安は解消できた。

研修を通して分かったのは、プログラミングそのものについてはそこまで難解なものではないということだ。
大切なのは、読解力や表現力、思考力、論理力といった基礎的な教養にあると思う。
これらの力が十分に備わっていれば、専門的な知識であっても、一定の学習を積めば理解できるだろう。

そして、このOFF-JTでは学習に取り組みやすい環境が整っていた。
先輩社員とは、メッセージや通話を通して気軽に質問できる上、会社にはプログラミング言語等、必要な知識を得るための本が用意されている。

今回の研修を通して、従来型の開発やAIに関する知識や経験を身につけ、大きく成長することができたと思う。
これらを踏まえ、今後の業務にも尽力していきたい。