データサイエンスでイノベーションを加速

組織全体でデータサイエンスを生産性高く展開

TIBCO® Data Scienceとは

データサイエンスはチームスポーツです。データサイエンスでは、繰り返し分析アルゴリズムを走らせ分析精度を向上させ、ビジネス活用への最適化を図る必要があるため、データサイエンティストやビジネスユーザー、開発者は、その一連の分析プロセスの共有、自動化、そして分析ワークフローの再利用が可能な、柔軟で拡張性のある分析プラットフォームを必要としています。
また、アルゴリズムは最先端アナリティクスの一部でしかありません。企業は分析モデルの構築に加え、管理や分析モデル精度のモニタリングにも注意しなくてはなりません。一般的にデータサイエンスの運用プロセスは難解で手間でがかかるので、企業は、エンドツーエンドで分析ライフサイクルをサポートし、かつエンタープライズレベルでのセキュリティとガバナンスを提供するプラットフォームを必要としています。

「TIBCO® Data Science」では、このようなデータサイエンスのデプロイ・運用に伴う課題一式を解決し、予測的知見が、組織のイノベーションや複雑な問題の早期解決に資するために必要な支援をワンストップで提供しています。

機能

コラボレーションを支援

TIBCO® Data Scienceは、一部のデータサイエンティストだけではなく、データエンジニア、開発者など、部門横断型でのコラボレーションを活性化させる機能を備えています。直観的なWebブラウザーのインターフェースや、包括的なデスクトップ機能によって、分析ワークフローを共有したり、メンバー間でコメントのやりとりや、マークアップなどができます。同時に、透明性、セキュリティ、バージョン管理、オーディタビリティも維持されています。TIBCO® Data Scienceは機械学習、データ、プロセス、人を結びつけ、ビジネスに必要なデータサイエンスをワンストップで提供します。

データの再利用を促進

データの再利用を促進

作成された機械学習の分析テンプレートは、本番環境へ簡単にデプロイされ、共有されます。またモデルのモニタリングや、管理もでき、これによってデータサイエンスが強化されます。ビジネスユーザー、データエンジニア、開発者、データサイエンティストの共同作業が促進され、分析的アプローチによって複雑な問題への理解が進みます。

ビッグデータ分析をシンプルに

ビッグデータ分析をシンプルに

アルゴリズム、ビッグデータ、エッジプロセッシング、サーバーレステクノロジーなどは、難解で導入への障壁が高いものです。
TIBCO® Data Scienceでは、SparkやHadoopの分析ライフサイクルを簡易に扱いやすくすることができます。
データプリパレーションや予測分析ワークフローを自動化し、クラスター内で直接スケーリングすることが可能です。分析プロセスの自動化、ジョブのスケジューリング、プロジェクトの監視および高速化により、組織全体が生産性良くデータサンエンスを活用することができるようになります。

データサイエンスの運用効率化

データサイエンスの運用効率化

多くの組織はアナリティクスを本番環境にデプロイすることに苦労しています。TIBCO® Data Scienceでは、データが変動して分析モデルが劣化した場合でも、新しい分析モデルを組み直し、自動でデプロイするので、信頼できる結果に基づいた意思決定をすることができます。

イノベーションを後押し

イノベーションを後押し

搭載されている、最新のディープラーニングや予測、プリスクリプティブ、AI、および分析手法を活用し、革新的なモデルを生成することができ、これによって、組織でのアナリティクス活用が促進されます。
また、新たな分析モデルのプロトタイプを、ビルドインされた関数やアルゴリズム、またPythonやR、Scalaを使って、スピーディかつ柔軟性をもってに試行することができます。ビジネスで持続的な競争優位を保つために必要なイノベーション ー新しいビジネスチャンスや新収入源を発掘したり、資産の収益化方法などーを後押ししていきます。

データからインサイトを引き出す

データからインサイトを引き出す

TIBCOプロダクトラインナップとして、「TIBCO® Data Science」に加え、データサイエンスに必要なソフトウエアと機能をワンストップで提供します。「TIBCO® Data Science」を使った分析結果を「TIBCO Spotfire®」で可視化します。
リアルタイム・ストリーミング分析には「TIBCO® Streaming」を活用、エッジアナリティクスには「TIBCO Flogo® Enterprise」します。更に「TIBCO Cloud™ Live Apps」を使用することで、ビジネスプロセスにデータサンエンスというワークフローを簡単に組み込むことも可能です。

特長

あらゆる分析をビルトイン

あらゆる分析をビルトイン

16,000以上の関数やアルゴリズムが、ビルトインされています。予測分析や回帰分析、クラスタリング、時系列、決定木、ニューラルネットワーク、機械学習、データマイニング、多変量解析、統計的プロセス制御(SPC)、実験計画法(DOE)、グラフ/ネットワーク分析、テキスト分析まで、ビルトインされた関数やアルゴリズムは、簡単に利用することができます。

ビッグデータのための機械学習

ビッグデータのための機械学習

繰り返しデータを学習するビッグデータ機械学習アルゴリズムによって、分析モデルの最適化を自動で行います。、プログラミングをする必要はありません。

チームコラボレーション

チームコラボレーション

データの前処理、読み込み、アナリティクスといった一連のワークフローを、直観的なドラッグ&ドロップのユーザーインターフェースで簡単に作成できます。データ分析に関わっているビジネスエキスパート、データサイエンティスト、データエンジニア、開発者などのチームメンバーはデータやスクリプト、モデル、ワークフローを共有しコメントのやりとりをすることができるので、コラボレーションが進みます。

モニタリング、管理・デプロイ

モニタリング、管理・デプロイ

アンサンブル学習によって、作成した分析モデルの有効性をチャンピオン/チャレンジャーテストで比較します。
モデル精度をモニタリングし、モデルが劣化した際には簡単にリフレッシュすることが可能です。モデルだけでなく、ワークフロー全体をデプロイすることができます。また、ワークフローのスケジュール実行、PMMLやPFAといった分析フォーマットに準拠したリアルタイムスコアリングモデルのCloud Foundry、AWS、Google App Engineへのプッシュも可能です。EMRやRedshiftでモデルを構築し、オンプレミス環境やOracle、Teradataへのデプロイ、リアルタイムスコアリングエンジンへのプッシュも可能です。

セキュリティ、ガバナンス、監査対応

セキュリティ、ガバナンス、
監査対応

KerberosやRanger、Sentryに対する分析ソリューションのデプロイは面倒なため、多くのオープンソースの実装は適していません。TIBCO® Data Scienceは、堅牢なクラスターと連携し、HiveやSparkがITデータセキュリティ方針の範囲内で高度なデータ分析を実行可能にします。システム内の任意のアセットに対してユーザー権限を定義するためのバージョン管理、監査ログ、承認プロセス機能が組み込まれています。

オープンソースによる柔軟性と拡張性

オープンソースによる
柔軟性と拡張性

オープンソースのR、Jupyter Notebooks、Python、C#やScalaスクリプトをシームレスに統合することでデータ分析のワークフローを拡張させることができます。これにより、ワークフローノードやカスタムオペレータをエッジやデータベースに対して直接実行することができます。

TIBCO® Data Science プラットフォーム概要

TIBCO® Data Scienceは、「TIBCO Statistica™」、「TIBCO Spotfire® Data Science(旧Alpine Data)」、「TIBCO Spotfire® Statistics Services」、および「TIBCO® Enterprise Runtime for R(TERR)」の機能をパッケージした統合スイートです。TIBCO® Data Scienceの柔軟なオーサリングやソフトウェア展開機能により、企業は組織全体にデータサイエンスの展開を拡張することが可能になります。

TIBCO® Data Scienceは、「TIBCO Statistica™」、「TIBCO Spotfire® Data Science(旧Alpine Data)」、「TIBCO Spotfire® Statistics Services」、および「TIBCO® Enterprise Runtime for R(TERR)」の機能をパッケージした統合スイートです

データサイエンス・オーサー

Team Studio(旧Spotfire Data ScienceおよびAlpine Data Labs)は共同作業を可能にするウェブベースのユーザーインターフェースを採用しています。これによりデータサイエンティストやシチズンデータサイエンティストが機械学習やデータ・プレパレーション・パイプラインを作成できるようになります。ユーザーはドラッグ&ドロップの使用およびJupyter Notebookによるシームレスなコードの統合が利用可能です。Slackのようなコラボレーション機能も搭載されており、この活用で、データサイエンスプロジェクトが加速していきます。

「TIBCO Statistica™」を使えば、デスクトップベースのリッチなユーザーインターフェースとビルトインされた16,000の関数やアルゴリズムで、高度なデータ分析ワークフローが作成可能です。ユーザーはPythonやRなどのノードをパイプライン内でシームレスに統合できます。さらに、Spotfireからワークフローを実行することも可能です。

TIBCO® Enterprise Runtime for R(TERR)は、エンタープライズ向けの高性能な統計エンジンです。さまざまなアプリケーションがAPIを通しTERRに接続することが可能です。Rで開発し、その後TERRにデプロイすることで、コーディングのやり直しや分析の再テストを行わずにプロトタイプから商用へとすばやく移行できます。

データサイエンス・オペレーション

Team Studioには"Distributed"の機能が必要です。"Distributed"とは、SparkやHadoopなどのビッグデータに対して分析ワークフローを実行できる点とコラボレーションを推進する機能が備わっていることを意味します。

"Core"はTIBCO® Data Scienceの核となる機能で主に「TIBCO Statistica™」が担います。高度なモデル管理、プラットフォーム管理、およびガバナンス機能などを提供します。

TERRには"Ecosystem"が必要です。"Ecosystem"とは、SAS、MatLab、R、Pythonなどのさまざまなエンジンでデータサイエンス・ワークロードを連携させることを意味します。