Python中模拟网页的javascript加密验证处理

      在做网络爬虫中很多人都会遇到,做得比较好的一些企业级网站,对于登陆或者其他操作都会对用户的输入做一些加密处理后再post到服务器上去,而加密这部分几乎都是通过JavaScript来完成的,所以要做爬虫,需要模拟 这些加密的处理。
      我比较喜欢Python来做爬虫,urllib/urllib2库用起来真的是很方便,所以很多时候遇到需要在python中来模拟网站的JavaScript加密过程。暂时总结起来有两种方法:
Continue reading Python中模拟网页的javascript加密验证处理 - 全文阅读

Python正则表达式心得整理

1.编译正则表达式
>>> import re
>>> p = re.compile(’ab*’,re.IGNORECASE)
>>> print p
<_sre.SRE_Pattern object at 0×012FB3E0>
得到了一个正则表达式的对象!RegexObject` 实例,可以为不同的操作提供方法,如模式匹配搜索或字符串替换。
类似于JAVA里面的正则编译。得到了这个正则实例之后就能够拿它出来进行了匹配搜索或字符串处理了!

Continue reading Python正则表达式心得整理 - 全文阅读

Python Daemon(守护进程)

def createDaemon():
    ”’Funzione che crea un demone per eseguire un determinato programma…”’
   
    import os
   
    # create - fork 1
    try:
        if os.fork() > 0: os._exit(0) # exit father…
    except OSError, error:
        print ‘fork #1 failed: %d (%s)’ % (error.errno, error.strerror)
        os._exit(1)

    # it separates the son from the father
    os.chdir(’/')
    os.setsid()
    os.umask(0)

    # create - fork 2
    try:
        pid = os.fork()
        if pid > 0:
            print ‘Daemon PID %d’ % pid
            os._exit(0)
    except OSError, error:
        print ‘fork #2 failed: %d (%s)’ % (error.errno, error.strerror)
        os._exit(1)

    funzioneDemo() # function demo
   
def funzioneDemo():

    import time

    fd = open(’/tmp/demone.log’, ‘w’)
    while True:
        fd.write(time.ctime()+’\n’)
        fd.flush()
        time.sleep(2)
    fd.close()
   
if __name__ == ‘__main__’:

    createDaemon()

python3.0与2.x之间的区别

1.性能
Py3.0运行pystone benchmark的速度比Py2.5慢30%。Guido认为Py3.0有极大的优化空间,在字符串和整形操作上可以取得很好的优化结果。
2.编码
Py3.0源码文件默认使用utf-8编码,这就使得以下代码是合法的:
>>>中国 = ‘china’
>>> print(中国)
china
Continue reading python3.0与2.x之间的区别 - 全文阅读

python 中的module

Python中的Module是比较重要的概念。常见的情况是,事先写好一个.py文件,在另一个文件中需要import时,将事先写好的.py文件拷贝到当前目录,或者是在sys.path中增加事先写好的.py文件所在的目录,然后import。这样的做法,对于少数文件是可行的,但如果程序数目很多,层级很复杂,就很吃力了。
有没有办法,像Java的Package一样,将多个.py文件组织起来,以便在外部统一调用,和在内部互相调用呢?答案是有的。
Continue reading python 中的module - 全文阅读

Python 多线程 XML RPC的实现

python 中的SimpleXMLRPCServer只能支持单线程访问对象.如果想使用多线程的 SimpleXMLRPCServer.最好的办法就是继承ThreadMixIn.简单吧:)下面是代码
Continue reading Python 多线程 XML RPC的实现 - 全文阅读

python国际化(i18n)和中英文切换

Python通过gettext模块支持国际化(i18n),可以实现程序的多语言界面的支持,下面是我的多语言支持实现:

1.         在python安装目录下的./Tools/i18n/(windows下例 D:\Program Files\Python25\Tools\i18n)目录中找到pygettext.py运行之,生成翻译文件模版messages.pot,内容大概是这个样子:

 

Continue reading python国际化(i18n)和中英文切换 - 全文阅读

glade+pygtk 试用札记

   由于用python写程序,我已经考察过了好几种python的界面编写包,默认的tcl/tk,wxWindow,近来又试用pygtk。感觉用
pygtk是最顺手的,大约是因为我不熟悉c++而更熟悉c和callback吧。在加上glade编辑界面非常迅速方便,我更喜欢这个python+
pygtk+glade的组合了。
   gtk的大名相信不用我多介绍,gnome就是用它开发的,pygtk是gtk的python接口封装(反正就是在python中调用gtk,具体名称是
什么我也没弄清楚)。glade是gtk的界面编辑工具,不象我们在win下熟悉的vb,c++builder等IDE,glade只管生产界面和产生相
关的代码,至于编译和代码编写,你还需要vim,gcc等其它工具。
Continue reading glade+pygtk 试用札记 - 全文阅读

Python多线程

Python的并行开发有两种方式:fork和thread(线程)。thread比fork更轻量级,具有更好运行效率和可移植性,在需要进行并行操作的场合首推thread。

python标准库内置一个thread模块,该模块提供一个轻便简易的多线程编程接口,可以无需任何修改就能够运行在Win、Solaris、Linux等操作系统上。浏览一下thread模块:

Continue reading Python多线程 - 全文阅读

 Page 5 of 13  « First  ... « 3  4  5  6  7 » ...  Last » 

Contact us

Admin: Bryan Wu