検証の結果、研究チームによるキャプション生成システム「Transform and Tell」は従来のものよりも高い評価スコアを得たようだ。
例えば、同画像について、これまでの最先端システムが「保育園の先生が彼の教室で虫を見せている(A nursery school teacher showing a bug to his class.)」とのキャプションを生成したのに対し、研究チームによるシステムでは「東京の保育士。政府は、より多くの女性が労働力として参画するのを促している。また政府は、母親が職場復帰するのに十分な子どものケアの考案しようとしている。(A day care worker in Tokyo. The government is trying to bring more women into the work force, and the government is trying to come up with enough child care for mothers to go back to work.)」とのキャプションを生成している。