利用 OSS Select,您可以使用简单的SQL语句从OSS的单个文件中选取内容,仅获取所需要的数据,从而减少从OSS传输的数据量,提升您获取数据的效率。
前提条件
- 目前支持RFC 4180标准的CSV(包括TSV等类CSV文件,文件的行列分隔符以及Quote字符都可自定义)和JSON文件,且文件编码为UTF-8。
- 通过控制台可以对128MB以下的文件提取40MB以下的数据记录。如果您需要处理更大的文件或返回更多的记录,请使用 API:SelectObject。
操作步骤
操作样例
假如名为
People的CSV文件,有3列数据,分别是
姓名、
公司和
年龄。
- 如果想查找年龄大于50岁,并且名字以Lora开头的人(其中_1,_2,_3是列索引,代表第一列、第二列、第三列),可以执行如下SQL语句:
select * from ossobject where _1 like 'Lora*' and _3 > 50
- 如果想统计这个文件有多少行,最大年龄与最小年龄是多少,可以执行如下SQL语句:
select count(*), max(cast(_3 as int)), min(cast(_3 as int)) from ossobject