博客
关于我
Hadoop之HDFS:Hadoop分布式文件系统--具体知识点
阅读量:79 次
发布时间:2019-02-25

本文共 3353 字,大约阅读时间需要 11 分钟。

HDFS?Hadoop???????

HDFS?Hadoop Distributed File System??Hadoop????????????????????????????????????????????????????????????????????????????Java API?????????HDFS???????


??????

??VMware 15???????????CentOS 7?????????Apache Hadoop 3.1.4???????Windows?Mac???????IDEA?IntelliJ IDEA????????????????????????Hadoop?????????????????


??????

  • Hadoop?????
  • Hadoop????????
  • Hadoop?????
  • HDFS????

  • ??????

  • ????????????
  • ??HDFS????????
  • ????HDFS?????
  • ??HDFS???????

  • ??????

    1. Hadoop?????

    Hadoop????????Apache Nutch???????????????????????????????????????Nutch???????????????2003??????????????????????????GFS?Google File System??MapReduce???????????Hadoop???????????

    2004??2005??Nutch?????????GFS?MapReduce?????????????????Hadoop???2008?1??Hadoop????Apache??????????????????

    Hadoop?????????????????????????????????????????

    2. Hadoop????

    Hadoop?????????????

    • 0.x???Hadoop?????????????????
    • 1.x????????0.x??????bug???????????
    • 2.x??????YARN??????????????????????????????????
    • 3.x????2.x????????HDFS????????????????????

    3. Hadoop????????

    Hadoop??????????????Apache Hadoop?Cloudera?Hortonworks?MapR?

    • Apache Hadoop?????????????????
    • Cloudera????????????????Impala???????????
    • Hortonworks????????Windows??????????
    • MapR????????Hadoop??????????????

    ??Hadoop??????

    Hadoop??????????

  • HDFS??????????????????????
  • MapReduce???????????????????????
  • YARN?Hadoop 2.x????????????????????????
  • 1. HDFS??

    HDFS????????

    • NameNode????????????????????????????????
    • DataNode??????????????????????
    • Secondary NameNode???NameNode????????????????

    2. YARN??

    YARN????????????

    • ResourceManager?????????????????
    • NodeManager??????????MapReduce???

    ??HDFS????

    1. ?????????

    HDFS???????????????128MB?????????????????????????????3????????????????

    • ???????hdfs-site.xml???dfs.blocksize??????????
    • ???????????dfs.replication?????????????????????????

    2. ?????????

    • ??????????????HDFS??????????????????????
    • ????????????????????????????
    • ??????????????????????????

    3. HDFS??

    HDFS????NameNode?DataNode?Secondary NameNode?

    • NameNode??????????????????
    • DataNode????????????????????
    • Secondary NameNode???NameNode??????????????????????

    4. ?????

    • ?????????????????????
    • ?????????Unix???????????????

    ??HDFS????

    HDFS?????????hadoop fs?hdfs dfs?????????????????????????????????

    • ?????
      hdfs dfs -mkdir /path
    • ?????
      hdfs dfs -put local_file hdfs_path
    • ?????
      hdfs dfs -get hdfs_path local_file
    • ?????
      hdfs dfs -rm hdfs_path

    ??HDFS????

    HDFS?????????????????????????????????????????????????

    • ????????????????99.9%?????????????
    • ????????????????????hdfs dfsadmin -safemode enter | leave | get | wait?

    ??Java API??

    1. ????

    • Windows?????Hadoop??????????????????
    • Mac??????????????Hadoop???

    2. ?????????

    ??Maven???????Hadoop?????

    org.apache.hadoop
    hadoop-client
    ${hadoop.version}

    3. Java API????

    @Testpublic void createDirectory() throws IOException {    Configuration configuration = new Configuration();    configuration.set("fs.defaultFS", "hdfs://node01:8020");    FileSystem fileSystem = FileSystem.get(configuration);    Path dirPath = new Path("/kaikeba/dir1");    FsPermission permission = new FsPermission(FsAction.ALL, FsAction.READ, FsAction.WRITE);    fileSystem.mkdirs(dirPath, permission);    fileSystem.close();}

    ?????????

  • ?????HDFS?????????????????????
  • ???????HDFS??????????????????
  • ?????HDFS???????Hive?Spark??????

  • ???????????????HDFS????????????????

    转载地址:http://fg.baihongyu.com/

    你可能感兴趣的文章
    Oracle11g静默安装dbca,netca报错处理--直接跟换操作系统
    查看>>
    oracle12安装软件后安装数据库,然后需要自己配置监听
    查看>>
    Oracle——08PL/SQL简介,基本程序结构和语句
    查看>>
    Oracle——distinct的用法
    查看>>
    oracle下的OVER(PARTITION BY)函数介绍
    查看>>
    Oracle中DATE数据相减问题
    查看>>
    Oracle中merge into的使用
    查看>>
    oracle中sql查询上月、本月、上周、本周、昨天、今天的数据!
    查看>>
    oracle中sql的case语句运用--根据不同条件去排序!
    查看>>
    oracle中关于日期问题的汇总!
    查看>>
    Oracle中常用的语句
    查看>>
    oracle中新建用户和赋予权限
    查看>>
    Oracle中的rownum 和rowid的用法和区别
    查看>>
    oracle中的大小写、字符、dual、数字、处理、日期、函数、显/隐式、时间、条件表达式case、decode、to_date、to_char、sysdate
    查看>>
    oracle典型安装失败,安装oracle 10失败
    查看>>
    Oracle监听配置、数据库实例配置等
    查看>>
    oracle系统 介绍,ORACLE数据库管理系统介绍
    查看>>
    oracle获取数据库表、字段、注释、约束等
    查看>>
    Oracle计划将ZGC项目提交给OpenJDK
    查看>>
    Oracle闪回技术(Flashback)
    查看>>