谷歌AI團隊近日推出了一款新型圖像標注方式——“流體標注”,即采用機器學習來注釋分類標簽并勾勒出圖片中的每個對象和背景區域。谷歌官方表示其可將標記數據集的速度提高三倍。 “數據標注是人工智能產業的基礎,是機器感知現實世界的起點。從某種程度上來說,沒有經過標注的數據就是無用數據。”美國加州科技大學校長秦志剛教授在接受科技日報記者采訪時表示,機器識別事物主要通過物體的一些特征。被識別的物體還需要通過數據標注才能讓機器知道這個物體是什么。 “谷歌推出的流體標注模型主要利用人工智能學習的基礎,對圖像數據進行自動標注,對于標注不準確或者出現偏差的地方可以通過人工調整,從而提高標注效率。”秦志剛指出,即便該模型可借助機器學習提升標注速度,但最初還需進行人為地數據標注,為其提供初始訓練數據集。事實也正是如此,為了標注圖片,谷歌預先以約一千張具有分類標簽和信任分數的圖片訓練了語意分割模型。 |