• 《阿古顿巴》藏语版在藏语卫视首播 2019-09-06
  • 晋中市“三同步”推动互联网治理创新 2019-08-27
  • 法媒:研究称美国人常用药物或增加抑郁风险 2019-08-27
  • 宝贝是地名,你能想到这么浪漫的地名在哪儿吗? 2019-08-15
  • 何树山副省长到方圆机电调研指导工作 2019-08-15
  • 南粤好彩三开奖:今天遇到的一个面试题,我比较没思路,大家帮忙看看帮忙给个思路或代码

    来源:本网整理

    彩票双色球历史开奖结果 www.s9h6.com 今天面试,遇到一个问题,学的不是很好,向大家求助。问题如下:

    有一个txt文档,里面有两个字段,一个name,一个age。然后底下是两百万条数据,类似于如图:

    第一问:如何将这一百万条数据通过java读取,并且存取到一个mysql表中,

    第二问:这一百万条数据存入磁盘,大概占多少存储空间?

    第三问:一个数据库有2亿条数据,count(*)估计时间会很长,如何优化查询,优化更新?

    第四问:那些汉字不能存在char[]中,不在unicode中

    @皮总 @红薯
    =======================其他用户的看法====================

    第一问:使用mysqlimport导入数据。最好不要使用insert into。

    第二问:如果存储是{char(15), unsigned tinyint }, Utf8(1Bytes to 3Bytes per character),tinyint 1Bytes 。那么(3*15 + 1)× 1000000 / (1024*1024.0) 大约 44M大小。

    第三问:给主键添加索引, 更新planner statistics。而且根据某个字段合理分区,这样查询会很快。

    第四问:不知道,但是我想不存在这样的汉字不在unicode中


    ===========================================

    第四问:不知道,但是我想不存在这样的汉字不在unicode中

    汉字好像有7万多个,而 Unicode 按极限来算只能表示65536个字符,所以不在 Unicode 里的汉字很多。


    ===========================================

    那些汉字不能存在char[]中,不在unicode中


    回答生僻字就ok了。。本来这个问题就没法具体回答


    ===========================================
    Unicode 编码能表示所有的汉字, 所以,我也认为, 不存在用unicode无法表示的汉字.
    ===========================================

    第一个问题:

    try(BufferedReader reader = new BufferedReader(new FileReader("filename"))){
    String line = null;
    while((line = reader.readeLine()!=null){
    String[] strs=line.split("\\t");
    //根据strs值构建sql,或者批处理插入
    }
    }catch(Exception e){
    e.printStackTrace();
    }

    第二个问题:

    一个汉字一般占2个字节,一个字母占一个1个字节,你这种数据100万左右的记录,即便有复杂的索引,也应该不会超过20M。

    第三个问题:

    可以使用count(0)代替count(*)来提高一点效率,你所说的2亿条记录,可以采用分表,建立索引的办法提高效率。

    第四个问题:

    没太看到你的意思~汉字的Unicode编码范围:\u4E00-\u9FA5 \uF900-\uFA2D,超出这个范围就不是汉字了。

    你这种需求,可以直接将文本导出mysql dump工具需要的格式,使用mysql bin目录下的dump工具导入表中,这种效率更高。


    ===========================================
    学习了。
    ===========================================

  • 本文相关:
  • CXF“NULL”值一直报异常!
  • Widget使用SurfaceView
  • linux环境下,怎么获取视频文件的播放时间 属性
  • java中关于字符集出现?的问题
  • 怎样在windows下安装vim
  • 测试多个(如五十个IP时)为什么报错?用pip下载ping.py(改名为:ping_pip.py)代码,作为module被调用。
  • C++ fstream 读取汉字的问题
  • 大家好,帮忙看一个问题
  • python新手代码,请各位大牛提出修改、重写意见。
  • php5.4.17 不支持 pear运行吗?
  • 免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 彩票双色球历史开奖结果 - 频道导航
    Copyright © 2017 彩票双色球历史开奖结果 www.s9h6.com All Rights Reserved
  • 《阿古顿巴》藏语版在藏语卫视首播 2019-09-06
  • 晋中市“三同步”推动互联网治理创新 2019-08-27
  • 法媒:研究称美国人常用药物或增加抑郁风险 2019-08-27
  • 宝贝是地名,你能想到这么浪漫的地名在哪儿吗? 2019-08-15
  • 何树山副省长到方圆机电调研指导工作 2019-08-15
  • 快乐10分怎么玩法 以前的捕鸟达人1 吉林十一选五前三直选遗漏 北京赛车tk10 通比牛牛有庄家吗 481开奖直播视频 六合彩白小姐曾道人特码 六合图库资料大全 网球王子 时时彩开奖结果 内蒙福彩时时彩开奖号码走势图 胆拖中奖查询 三倍猴子游戏下载 360竞彩足球即时比分直播 3d开机号试机号开奖号走势