记一次对博客死链的清除

今天,我打开博客之后,发现有加载缓慢的情况。
F12之后,发现了一个无效链接。如下:
2014-11-30 19:05:05 的屏幕截图

我知道我的网站是没有经过大的改动的,唯一的就是开启了几个插件。

然后我就登陆服务器去找,想知道罪魁祸首是什么?

不过在那么一堆文件里找一个网址,如图大海捞针一样。

当然你的服务器不会让你这么痛苦的,find命令会帮你搞定。

我去网上搜索了一下,得到了几个find的用法。如下:

  • 查找文件中是否有某个字符串
  • find . | xargs grep -ri “字符串”
  • 如果只想显示出文件名
  • find . | xargs grep -ri “字符串” -l

find是Linux下非常强大的搜索工具,有空我还要深刻学习一下,不过这次就先这样了吧!

以下是执行之后的效果,找到了!

2014-11-30 19:11:56 的屏幕截图

有时候插件名和文件夹名不一样,但是认真观察的话还是可以知道插件名的。不过我是直接进入之后看程序备注就知道文件名了。

然后直接关掉这个插件。至此,一个不正常的外链就被我修好了。

ItPP Team 的第0个项目

恩,这是个算不上项目的项目

主要是提供免费空间以及免费博客的想法而已,服务器放着也是放着 多帮助别人还是极好的。

以下是简介:

ItPP团队看到了很多求免费空间的朋友,作为过来人,我们很清楚的了解,一个月上百元的服务器费用对很多人来说(尤其是学生),也是一笔不小的开支。

所以我们决定了发起这个项目,用来帮助想要拥有自己的博客或者网站的朋友!

附上链接

个人博客扶持项目

 

最后,再次:欢迎任何喜欢互联网的朋友加入我们

帮基友测试主题 ~(≧▽≦)/~

嘛,先来介绍一下吧:

PosArt

一个同是站长的朋友3天完成的作品,实在是让我惭愧。

考虑之后就拿过来用了,不过和我的wordpress怎么有点不兼容。

也算是帮忙测试吧!为其一个月,暂时没法设置友链了,对不起朋友们了!


下载地址:

度娘盘:http://pan.baidu.com/s/1h668d

Gitbut:https://github.com/lingoys/posart

(我用的是github上的,这个是相对来说最新的版本,建议使用这个。如果你不知道github,赶快去百度吧! )

由于最近没有网络,所以我这是在网吧写的!

当然,针对本主题的意见以及改动,我也会做出建议的。

加油,我可爱的小伙伴们!

嘛,惨不忍睹啊!

初学Python,一只小爬虫

说是爬虫,其实就是个网页下载的脚本。当然,作为第一次,我是献给了wordpress!

开始学习python,渐渐地想要做点什么。

有时候,我们去看别人的博客,无法看到全部的文章,有些或许已经遗失了,有些藏得太深,这是一份遗憾吧!

如果有个脚本能够帮我下载所有的存在文章就好了,我这样想到。
所以我写了这个爬虫,以下是源码。

[php]
#coding = utf-8
print u”’
#—————————————————————-
#程序:wordpress爬虫
#功能:直接下载整个wordpress站点所有文章
#只能用于wordpress搭建的站点,不排除有更改参数导致错误的的可能
#—————————————————————-
”’

import urllib2
import re

print u’请输入wordpress博客域名,例如:“gaobo.name”,’
url = raw_input(‘>’)
print u’请输入要下载的最大文章数’
p = int(raw_input(‘>’)) + 1

ps = range(1,p)
def getHtml():
print u’开始下载中’
for post in ps:
urls = bytes(‘http://’ + url + ‘/’ + ‘?p=’ + bytes(post))
try:

html = urllib2.urlopen(urls).read()

with open(bytes(post) + ".html","w+") as wp:
wp.write(html)
print bytes(post) + u’号文章ok’

except urllib2.HTTPError,e:
print bytes(post) +u’号文章发生错误,代码’+ bytes(e.code)

getHtml()
[/php]

现在看起来还有点别捏,不过这是前几天边看书边写的,现在虽然可以做得更好,但是还是想作为留念。

大致功能就是,把存在(已发布)的文章,或者元素(图片什么的),也就是wordpress不返回404的页面全部下载。
用的是”?p=”,这个get。应该是wordpress的pid吧。

目前还是功能太弱,只能下载网页,而且无法辨别文章标题;不过,作为第一次的脚本,我觉得很有成就感,O(∩_∩)O~


爬虫更新版,以下是代码。主要更新:以title保存文章,这样就能够找到感兴趣的文章了,好吧,已经可以了,此爬虫不在更新。
其实很简单,主要是中文编码不好办,搞了我一下午,结果是默认编码书写错误,应该用“:”的,我用错,用成“=”了。

[php]
# -*- coding: utf-8 -*-
print u”’
#—————————————————————-
#程序:wordpress爬虫
#功能:直接下载整个wordpress站点所有文章
#只能用于wordpress搭建的站点,不排除有更改参数导致错误的的可能
#—————————————————————-
”’

import urllib2
import re

print u’请输入wordpress博客域名,例如:“gaobo.name”,’
url = raw_input(‘>’)
print u’请输入要下载的最大文章数’
p = int(raw_input(‘>’)) + 1

patt = ‘<title>(.*?)|(.*?)</title>’

ps = range(1,p)
def getHtml():
print u’开始下载中’
for post in ps:
urls = bytes(‘http://’ + url + ‘/’ + ‘?p=’ + bytes(post))
try:

html = urllib2.urlopen(urls).read()
tt = re.search(patt,html).group(1).decode(‘utf-8′)

with open(tt + ".html","w+") as wp:
wp.write(html)
print bytes(post) + u’号文章ok’
print tt

except urllib2.HTTPError,e:
print bytes(post) +u’号文章发生错误,代码’+ bytes(e.code)

getHtml()
[/php]

我为什么使用阿里云服务器

最初搭建博客博客的时候,是王子哥帮我找的免费空间,虽然很好用,但总感觉用着不爽。

所以就想要买个自己的空间。是的,当初只想要空间。其实是我连vps是什么都不知道。

不得不说 aliyun 的广告做的非常好,虽然我已经忘了是如何知道阿里云云服务器的。但是,不可否认,良好的营销广告是非常有用的。知道阿里云之后,我就去搜索资料,然后看了那个介绍视频,好吧,我被打动了……

然后,就是痛苦的支付环节,最便宜的都有接近100元/月,跟网费差不多了。虽然很贵,但是,我一想:每个月挣钱没地方花啊,如何都随便花掉,那还不如买个服务器练习liunx命令,以及学习web开发啊!

当初我其实连vps是什么都不知道,所以当知道阿里云之后。我也去找过vps,但是没有找到适合我的,有些在国外的备受好评的服务商。我怕操作不方便,而且都是英语的话,估计会压力很大。

一咬牙,先买两个月试试再说。

这样就有了一台服务器。然后就是博客程序,我以前只接触过PHP开发的:wordpress。好吧,就用这个。wordpress的插件是世界上最全的,不论需要什么功能几乎都有,而且——博客,更重要的是文章、是思想、是有用的记录,这是一个博客的灵魂。如果一个博客都是转载的文章,或者全是没用的广告文的话,不论用什么程序来搭建,都没有意义。

阿里云服务器 其实和普通的linux电脑差不多,可以像操作自己电脑一样操作。vps应该都是这样的吧!我也通过它学习了很多,比如:apache基本设置、lamp的安装 等等 linux基础


使用了很久的 阿里云 ,唯一的缺点是 备案 。没错,就是网站备案。

你们或许会说,其实备案很快,而且阿里云的快捷备案很好、很实用。但是,在这个伟大的祖国,微小的地域歧视还是存在的。我是北方人,甘肃人。或许在南方的朋友有些还没听说过这个地方。

我所在的城市是 天水 —— 天河注水 ,名字很棒的城市,你一定没听过。虽然这里有非常著名的四大石窟之一的麦积山石窟

我们这儿对比国内一线城市是很落后,而且垄断什么的经常有。所以,备案就被电信垄断了。不是使用甘肃本省的服务器,无法享受接入——也就是所有外省的都不行。虽然可以促进本省的发展,但是,这是互联网啊,我们追寻的就是自由啊!GFW已经让人很痛苦了,现在连备案的自由都被剥夺了。

好吧,其实阿里云还是很好的,对于这些无法正常备案的地区,有一个域名白名单可以使用。这样我的危机也算是解决了,好感UP

除了这个,云盾的安全防护也很棒。行走在网络上,难免与别人发生冲突,如果博客被迫关闭,那对于我来说是无法接受的打击,虽然你可以反击,但是那所造成的伤痕永远也无法修复。所以我选择了阿里云,因为他带给了我所需要的一切,虽然有点贵,但是物超所值,贵的有价值。

所以,本博客会一直运行在阿里云上,直到世界末日,或者我发生意外,否则,永不怠机

因为这是我追逐梦想的脚步,未到终点,我无法停止,因为我还活着。