ハーバード大学がAIモデルのトレーニング用データセットとして約100万冊のパブリックドメインの書籍を公開したと話題になっています。
シェイクスピアやディケンズなどの古典や、チェコの数学教科書、ウェールズ語の辞書といった多岐にわたるジャンルの本が学習されるそうですよ。
AIには「権利関係がはっきりしたデータセット」が必要な理由
AIは大量のテキストデータを学習することで、まるで人間かのような言語理解…
Source: ギズモード
ハーバード大学がAIモデルのトレーニング用データセットとして約100万冊のパブリックドメインの書籍を公開したと話題になっています。
シェイクスピアやディケンズなどの古典や、チェコの数学教科書、ウェールズ語の辞書といった多岐にわたるジャンルの本が学習されるそうですよ。
AIには「権利関係がはっきりしたデータセット」が必要な理由
AIは大量のテキストデータを学習することで、まるで人間かのような言語理解…
Source: ギズモード