こんにちは。株式会社モルフォの平井駿です。本ブログは二部構成の海外赴任体験記のうちの第二部です。第一部では駐在開始から技術者としての活動を中心に記載しました。第二部では、会社のCEOに任命されたのちに直面した経営課題およびその解決について記載します。
続きを読むフィンランド駐在体験記 第一部:ソフトウェアエンジニア編
こんにちは。株式会社モルフォの平井駿です。現在はフィンランドにあるグループ企業であるTop Data Science社に駐在員として赴任しております。本テックブログにおいては以前、COVID-19 Project 第1回として、「顔を触ってはいけない!」アプリを開発した記事を執筆しました。
今回は、ソフトウェアエンジニアとしてモルフォに入社した私が初めての海外駐在にてどのような危機に直面し、どのように乗り越えたかという体験記です。この記事は二部構成で、第一部がエンジニアとしての体験記。第二部が経営者としての体験記となります。こちらはその第一部です。
続きを読むOJT 2024:カメラを用いた自律探索
こんにちは。2024年入社の南です。今年度の新人グループ研修について報告します。
はじめに
弊社では2か月間のグループ研修を実施しています。今年度の参加者は朱と南の2名で、テーマは「カメラを用いた自律探索」です。
ここでいう自律探索とは、ロボットが予め与えられたプログラムのみに従って、未知の空間内を網羅的に動き回ることです。具体的には、被災地の地図作成や倉庫管理などへの応用が期待されます。今回私たちは、家の中を自動で探索しその家の間取り図を作成するロボットの開発を目指します。研修内容としてはSLAM(自己位置推定と地図作成)やナビゲーションといったタスクに取り組みます。
この研修では、センサーとして光学カメラのみを用いることが要件として与えられました。自律探索ができるロボットはすでに社会実装されており、掃除ロボットや配膳ロボットなどがそれに当たります。これらは主にLiDARセンサーやRGBDカメラなど周囲の物体までの距離を測定できるセンサーを用いています。光学カメラで撮った画像からはこの距離を計算するのが難しいものの、LiDARなどより安価なため、ロボットの価格を下げることが期待できます。
続きを読むJDLA主催「CVPR2024技術報告会」発表資料
先日、日本ディープラーニング協会主催(JDLA)の「CVPR2024技術報告会」にてモルフォの技術者が登壇いたしました。
昨年に引き続きまして、CVPRという国際学会の重要性や、今年のトレンドの分析、モルフォの技術者が注目した分野や論文について紹介しました。
当日の発表資料を共有させていただきます。
発表動画については是非以下のリンクからご視聴ください。
A Brief Survey of Schrödinger Bridge (Part I)
こんにちは、CTO室リサーチャーの長山と申します。
モルフォでは毎週金曜日に持ち回りで論文紹介等を行うJournal Clubという取り組みを行っています。 今回は、私がその場で発表したSchrödinger Bridge(シュレーディンガー橋; SB)という確率論的生成モデルスキームの解説スライドを公開いたします。
Stable DiffusionやMidjourneyに代表されるような画像生成AI手法は、ここ一年間で目覚ましい発展を遂げたことは記憶に新しいと思います。 その原動力となった基礎技術の一つが拡散モデル(Diffusion Models)です。 拡散モデルとは、データからノイズへと徐々に崩壊するような過程を学習し、その逆過程(すなわちノイズ除去)をシミュレーションすることで目標のデータを創り出すような手法と説明することができます(図1)。 高い生成品質かつ安定した学習を実現できることから、拡散モデルは画像生成AIにおける以前の主流であった敵対的生成ネットワーク(Generative Adversarial Networks; GANs)を現在進行系で置き換えつつあります。
続きを読む
OJT 2023: ジェスチャー認識とRealSenseを活用したARアプリ
こんにちは。23年度入社のリサーチャーの三冨です。入社後2か月間にわたったグループ研修の内容と結果について報告します。テーマは「深度情報を利用したアプリケーション」です。
はじめに
私たちはECサイトで用いられる商品紹介のためのARアプリを題材として研修を行いました。このようなアプリの例として家具の配置をシミュレートするARアプリが挙げられます。カメラ映像に3Dモデルをリアルタイムに重ねて表示できるものです。部屋を映せば家具のコーディネートが購入前に確認できます。
このようなアプリに、3Dハンドジェスチャー認識機能を搭載して機能拡張することを考えました。通常の2Dジェスチャー認識に加えてカメラと手の距離が分かることで、より正確な認識とより直感的な操作ができます。それを活かせれば、ゆくゆくは3Dモデルを実物のように運んだり動かしたりできそうです。
RealSenseはこのようなアプリの実装に適しています。RealSenseは深度(カメラと映った物との距離)センサとRGBセンサを合体させたデバイスであり、深度イメージ処理用のプロセッサや豊富なライブラリも用意されています。そのためリアルタイムに3Dジェスチャー認識するアプリを短期間で作成するのにうってつけでした。
続きを読むJDLA主催「CVPR2023技術報告会」発表資料
先日、日本ディープラーニング協会主催(JDLA)の「CVPR2023技術報告会」にてモルフォの技術者が登壇いたしました。
CVPRという国際学会の重要性や、今年のトレンドの分析、モルフォの技術者が注目した分野や論文について紹介しました。 資料を見たいという声を多数いただいたので発表資料を共有させていただきます。
発表動画については以下のリンクから是非ご視聴ください。 https://www.youtube.com/watch?v=XVgUvFig-_M