彭世瑜的博客

记录我的code历程 个人主页:www.pengshiyu.com

自定义博客皮肤

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Python爬虫:使用newspaper解析新闻页面信息

github: https://github.com/codelucas/newspaper 安装 pip3 install newspaper3k 代码示例 # -*- coding: utf-8 -*- from newspaper import Article url = &a...

2019-02-26 19:12:06

阅读数 370

评论数 0

Python编程:方差、标准差、均方差、均方根值、均方误差、均方根误差

python实现代码 # -*- coding: utf-8 -*- import math def get_average(records): """ 平均值 "...

2019-02-26 15:46:49

阅读数 2894

评论数 0

Linux-Mac配置SSH免密登录

修改host $ vim /etc/hosts 192.168.0.1 master 192.168.0.2 slave1 免密登录 1、原理: 将公钥拷贝到需要免登录的设备,私钥是自己的 通过用户名和主机名来核对公钥 A(公钥,私钥) --> B(A的公钥...

2019-02-26 14:43:52

阅读数 76

评论数 0

Python编程:使用gensim对中文文本进行相似度计算

gensim文档: https://radimrehurek.com/gensim/tutorial.html 安装 pip install gensim 代码示例 # -*- coding: utf-8 -*- import logging import jieba from gensi...

2019-02-25 18:19:56

阅读数 541

评论数 3

Python编程:通过交集并集计算文档相似度

分词函数 def split_word(document): """ 分词,去除停用词 """ stop_words = {":&q...

2019-02-25 18:06:43

阅读数 59

评论数 0

深度学习:Tensorflow的基本概念和张量

计算密集型(cpu计算) -tensorflow IO密集型(web,磁盘) -django -scrapy 1、基本概念 tensor 张量-数据结构 op 专门运算的操作节点 graph 图:整个程序的结构 session 会话:运算程序的图 图默认已经注册: 一组表...

2019-02-24 22:56:00

阅读数 49

评论数 0

深度学习:Mac下Tensorflow安装及报错解决

深度学习tensorflow 使用: 图像识别 自然语言处理 情感分析 人工智能 - 机器学习 - 深度学习 机器学习: -神经网络(简单) -回归 深度学习: -神经网络(深度) -图像:卷积神经网络 -自然语言处理:循环神...

2019-02-24 22:18:04

阅读数 180

评论数 0

Python编程:通过百度地图接口抓取机构的地址和电话信息

基本原理 1、百度地图开放了搜索接口 http://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-placeapi 2、使用【地点检索】接口搜索商家的地址、电话等信息 3、基本使用流程 (1) 申请百度账号 (2) 申请成为百度开...

2019-02-23 13:54:39

阅读数 716

评论数 5

Python编程:MySQLdb模块更新数据库获取影响行数

cursor游标方法和属性: fetchone(): 获取查询结果集的下一行 fetchall(): 获取结果集的所有行 rowcount: 返回受影响的行数 代码示例 import MySQLdb db = MySQLdb.connect("localhost&qu...

2019-02-23 11:18:55

阅读数 555

评论数 0

GIT:git stash临时存储代码

一个代码堆栈 常用的命令如下 # 增 git stash # 存储代码,压入代码堆栈 git stash save "message" # 推荐 # 查 git stash list # 查看现有记录 git stash show # 检查不一样的地...

2019-02-22 16:44:12

阅读数 205

评论数 0

Python编程:使用defaultdict统计词频

# -*- coding: utf-8 -*- # 要统计的词 words = ["腾讯", "百度", "阿里巴巴", "百度", &quot...

2019-02-21 15:36:08

阅读数 57

评论数 0

Python编程:字典排序sorted问题

思路:字典转为包含元组的列表排序 代码示例 dct = { "百度": 30, "阿里": 20, "腾讯": 25 } print(...

2019-02-19 13:44:33

阅读数 82

评论数 0

Python编程:ndarray数组的保存与读取

代码示例 # -*- coding: utf-8 -*- import numpy as np matrix = np.arange(12).reshape(4, -1) print(matrix) """ [[ 0 1 2] [ 3...

2019-02-19 09:55:54

阅读数 335

评论数 0

推荐引擎:基于余弦相似度书籍推荐Python实现

# -*- coding: utf-8 -*- # @Date : 2019-02-14 # @Author : Peng Shiyu from copy import deepcopy import numpy as np from sklearn.feature_extracti...

2019-02-18 16:15:45

阅读数 197

评论数 0

Python编程:time模块实现函数执行时间计时器

代码示例 import time import logging logging.basicConfig(level=logging.DEBUG) def timer(func): """ 函数执行计时器 &...

2019-02-15 16:35:04

阅读数 507

评论数 0

推荐引擎的基本入门知识

推荐引擎的分类 根据大众行为的推荐引擎 个性化推荐引擎 推荐引擎工作原理图 1. 基于人口统计学的推荐 2. 基于内容的推荐 3. 基于协同过滤的推荐 (1) 基于用户的协同过滤推荐 (2)基于项目的协同过滤推荐 (3)基于模型的协同过滤推荐 参考: 推荐引擎初探 ...

2019-02-13 19:31:14

阅读数 106

评论数 0

mysql批量插入重复不报错

方案一:ignore 主键已存在,不更改原纪录,只插入新的记录 INSERT IGNORE INTO 方案二:replace 主键已存在,则替换原记录,即先删除原记录,后insert新记录 REPLACE INTO 方案三:on duplicate key update 主键已存在,则执行UP...

2019-02-11 18:57:56

阅读数 324

评论数 0

提示
确定要删除当前文章?
取消 删除