代码:
data_files = {}
if args.train_data_dir is not None:data_files["train"] = os.path.join(args.train_data_dir, "**")dataset = load_dataset("imagefolder",data_files=data_files,cache_dir=args.cache_dir,)
数据:
想要读进图片和以及对应的caption, 结果只是读出来了和label(这里只有一个文件夹,所以label全是0)。 于是一直找错,查看huggingface官网:https://huggingface.co/docs/datasets/v2.4.0/en/image_load#imagefolder
自己代码和他写的一摸一样,为什么会把caption读不进去呢?
终于。。。。。。
发现了我的 datasets的版本是2.1.0。 发现我浏览的huaggingface官网的版本是2.4.0。 好的,立马换了版本,over,成功读如图片和caption!!!!