ニュースリリース

2023.03.09

◆サイバーテック   テキストマイニング用AIの教師データ作成サービスを開始 ~英語圏となるフィリピンの自社オフショア拠点による、日英の教師データ作成も対応~

  ITにより企業のDX化推進をサポートする、株式会社サイバーテック(代表取締役社長:橋元 賢次 本社:東京都渋谷区、以下サイバーテック)は、このほど、テキストマイニング用AIシステムの教師データ作成サービスを開始した。

 DX(デジタルトランスフォーメーション)の推進が求められている昨今、AIを活用することによるビジネスモデル改革や業務カイゼンは進んでおり、社会へのインパクトは日増しに大きくなっている。そのような中、SNSで投稿された内容や口コミからの掘り起こし、アンケートに書かれた文章の分析、文章内のおおよその意味を判別するネガポジ判定や、論文などから必要とするテキスト情報を抽出するといった、テキストマイニングにもAIの活用が進んでいる。
   さらに、自然言語処理技術も進んだ結果、Google翻訳に代表される機械翻訳の性能向上や、話題性の高いAIチャットサービス「ChatGPT」の登場など、コミュニケーション分野におけるAI技術の向上は目覚ましいものがある。これらのテキスト情報を扱うAIシステムでは、コーパス情報をはじめとする大量の教師データの準備が求められている。

   サイバーテックでは、数年前にAIによるゆらぎ検出~ライティング支援エンジンを自社開発したことを皮切りに、フィリピンに有する自社オフショア拠点「セブITアウトソーシングセンター」にて、AIシステム向けのアノテーションサービス「セブ ハイスペック アノテーション」を提供してきた。今回リリースした「テキストマイニング用AIシステムの教師データ作成サービス」は、AIによるゆらぎ検出~ライティング支援エンジンでも必要とされた教師データ作成ノウハウをベースに、テキスト情報へのアノテーションサービスをリーズナブルに提供することになった。

   特に、自社オフショア拠点「セブITアウトソーシングセンター」があるフィリピンは、公用語が英語であり、新興国の中でも非常に高い英語力を有する地域となっている。したがって、テキストマイニング用AIシステムに用いられる教師データは日本語に限らず、英語による論文や調査記事、英字新聞などといった、英語コンテンツを対象とした教師データ作成も可能である。

DX推進に不可欠!「テキストマイニング用AIシステムの教師データ作成」の特徴
サイバーテックの「
テキストマイニング用AIシステムの教師データ作成」サービスの特徴は次の3点となる。

公用語が英語のフィリピンで実施、高い英語読解力で学習データの品質にも直結!
   英文に対するアノテーションを実施するうえで、しっかりとした英文の読解力は最低限必要となるが、同社が自社オフショア拠点を有するフィリピンは、高い英語力を有する人材が多数存在する。その中でもセブ島エリアはフィリピンの首都マニラと比較した場合、おおよそ3分の2の物価であるにもかかわらず、数多くの英語スクールが存在するとともに、オンライン英会話の講師が多く輩出される高い英語力を有する人材が豊富なエリアである。したがって、英語テキスト情報に対しても高品質かつリーズナブルなアノテーション作業を行うことが可能である。

在宅スタッフではなく、直接雇用の正社員による、安定したアノテーション品質!
   アノテーション作業は、オフィスに出社している直接雇用の正社員が行うので、社内でFace to Faceによるコミュニケーションを取りながら、高品質のアノテーション作業を実施することが可能である。経験豊富なアノテーションマネージャが進捗管理やチェック体制の構築、指示書の作成や見直しなどを行い、アノテーション経験が豊富なメンバーで構成されたチーム体制での作業となるため、属人的な「バラツキ・誤差」を極力なくし、高品質なテキストマイニング向け教師データ作成を実現している。ちなみに、セブITアウトソーシングセンターには日本人も複数名在籍しているので、日本語のテキストを対象としたアノテーションも対応可能である。

ラボ型のメンバー固定で、プロジェクト並走型アノテーションもリーズナブルに可能!
  一般的なアノテーション業務委託の形式でもリーズナブルにテキストマイニング用AIシステムの教師データ作成が可能であるが、セブITアウトソーシングセンターの経験豊富なアノテータースタッフやアノテーションチームごと、皆様の企業におけるアノテーション部門としてBynameによるラボ型の要員固定を行うことが可能である。これにより、大規模AIシステムのモデル構築と並走した形で学習データ作成体制を構築することや、長期プロジェクトでのさらなる品質向上とコストダウンを実現することが可能となる。

DX推進に不可欠!「セブ ハイスペックアノテーション」の特徴
  サイバーテックが提供する、AIシステム向けのアノテーション作業代行「セブ ハイスペック アノテーション」サービスでは、主に画像データを中心に、次のようなAIシステム向けの学習データ(教師データ)作成を実施してきた。

  セグメンテーション~画像からの領域抽出

  キーポイント付与~画像への特徴点付与

  バウンディングボックス付与~画像からの物体認識

  データセットの分類~クラシフィケーション

  学習データの拡張~データアーギュメンテーション

今後は、ドキュメントソリューション事業と親和性が高い「テキストマイニング用AIシステムの教師データ作成」サービスをラインナップに加えることにより、画像データセットに対するアノテーションに加え、テキストデータに対するAIアノテーションにもサービス対象範囲を広げることになった。これにより、サイバーテックは、AI分野をはじめ、さらに付加価値の高い自社製品・サービスを提供していく。

■「テキストマイニング用AIシステムの教師データ作成」サービス 紹介ページ
「テキストマイニング用AIシステムの教師データ作成」サービスをご案内するWebサイトは以下となる。
URL
https://www.cybertech.co.jp/ito/service/text-mining/
■「AIアノテーション・BPO」事業 紹介ページ
AIアノテーション・BPO」事業をご案内するWebサイトは以下となる。
URL
https://www.cybertech.co.jp/ito/

サイバーテックは、企業の情報化投資において、高い費用対効果とDX対応を実現するソフトウェア製品とITサービスを企業の皆さまに提供している。今回の取り組みにより、得意とするドキュメンテーション分野と、英語圏オフショアの強みを活かしたAIアノテーションサービスを拡充させることで、ユーザーのDX推進のサポートをしている。

<同件に関する問い合わせ先>
株式会社サイバーテック 管理部 広報担当:薮田

150-0044 東京都渋谷区円山町20-1 新大宗道玄坂上ビル7

TEL03-5457-1770 FAX03-5457-1772

URL
https://www.cybertech.co.jp/  メール:info@cybertech.co.jp
 

カレンダー

«3月»
   1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

カテゴリーリスト

最近のエントリー

フィード