python操作hdfs

Jupyter开发环境

1、右侧打开Jupyter,并创建python3项目。

在这里插入图片描述

python操作hdfs例子

from pyhdfs import HdfsClient
#https://pypi.org/project/PyHDFS/

fs = HdfsClient(hosts=["app-11:9870"],user_name="hadoop")
print("client:",fs.list_status('/'))

fs.list_status('/')

fs.listdir('/tmp')

fs.create('/tmp/fruit/apple', 'delicious')

fs.copy_from_local(dest="/tmp/youtube.data", localsrc="/hadoop/Hadoop/hadoop-3.1.2/etc/hadoop/hdfs-site.xml")

fs.listdir('/tmp')

详细学习内容可观看Spark快速大数据处理扫一扫~~~或者引擎搜索Spark余海峰 在这里插入图片描述