读取csv格式数据第一列
读取csv格式数据的第一列,可以使用Python中的numpy包的read_csv函数。具体操作步骤如下:
1. 使用glob库获取所有需要读取的csv文件路径。
2. 使用for循环遍历文件,并使用pd.read_csv函数读取每个文件的第一列。
3. 将读取到的数据转换为列表类型,并加入到一个总的嵌套列表中。
4. 最后,可以使用set函数将嵌套列表转换为无重复元素的列表。
需要注意的是,如果CSV文件中含有BOM字节,可能会导致第一列获取不到数据。这种情况下,可以使用org.apache.commons.io.input.BOMInputStream来解决这个问题。
