Python中异常重试解决方案-JobPlus

在做数据抓取的时候，经常遇到由于网络问题导致的程序保存，先前只是记录了错误内容，并对错误内容进行后期处理。

原先的流程：

1. def crawl_page(url):

4. pass

10. def log_error(url):

11.

12.

13. pass

14.

15.

16.

17.

18.

19. url = ""

20.

21.

22. try:

23.

24.

25. crawl_page(url)

26.

27.

28. except:

29.

30.

31. log_error(url)

改进后的流程：

1. attempts = 0

4. success = False

7. while attempts < 3 and not success:

10. try:

11.

12.

13. crawl_page(url)

14.

15.

16. success = True

17.

18.

19. except:

20.

21.

22. attempts = 1

23.

24.

25. if attempts == 3:

26.

27.

28. break

最近发现的新的解决方案：retrying

retrying 是一个 Python 的重试包，可以用来自动重试一些可能运行失败的程序段。retrying 提供一个装饰器函数 retry，被装饰的函数就会在运行失败的条件下重新执行，默认只要一直报错就会不断重试。

1. import random

4. from retrying import retry

10. @retry

11.

12.

13. def do_something_unreliable():

14.

15.

16. if random.randint(0, 10) > 1:

17.

18.

19. raise IOError("Broken sauce, everything is hosed!!!111one")

20.

21.

22. else:

23.

24.

25. return "Awesome sauce!"

26.

27.

28.

29.

30.

31. print do_something_unreliable()

如果我们运行 haveatry 函数，那么直到 random.randint 返回 5，它才会执行结束，否则会一直重新执行。

retry 还可以接受一些参数，这个从源码中 Retrying 类的初始化函数可以看到可选的参数：

· stopmaxattempt_number：用来设定最大的尝试次数，超过该次数就停止重试

· stopmaxdelay：比如设置成 10000，那么从被装饰的函数开始执行的时间点开始，到函数成功运行结束或者失败报错中止的时间点，只要这段时间超过 10 秒，函数就不会再执行了

· wait_fixed：设置在两次 retrying 之间的停留时间

· waitrandommin 和 waitrandommax：用随机的方式产生两次 retrying 之间的停留时间

· waitexponentialmultiplier 和 waitexponentialmax：以指数的形式产生两次 retrying 之间的停留时间，产生的值为 2^previousattemptnumber * waitexponentialmultiplier，previousattemptnumber 是前面已经 retry 的次数，如果产生的这个值超过了 waitexponentialmax 的大小，那么之后两个 retrying 之间的停留值都为 waitexponentialmax。这个设计迎合了 exponential backoff 算法，可以减轻阻塞的情况。

我们可以指定要在出现哪些异常的时候再去 retry，这个要用 retryonexception 传入一个函数对象：

1. def retry_if_io_error(exception):

4. return isinstance(exception, IOError)

10. @retry(retry_on_exception=retry_if_io_error)

11.

12.

13. def read_a_file():

14.

15.

16. with open("file", "r") as f:

17.

18.

19. return f.read()

在执行 readafile 函数的过程中，如果报出异常，那么这个异常会以形参 exception 传入 retryifio_error 函数中，如果 exception 是 IOError 那么就进行 retry，如果不是就停止运行并抛出异常。

我们还可以指定要在得到哪些结果的时候去 retry，这个要用 retryonresult 传入一个函数对象：

1. def retry_if_result_none(result):

4. return result is None

10. @retry(retry_on_result=retry_if_result_none)

11.

12.

13. def get_result():

14.

15.

16. return None

在执行 getresult 成功后，会将函数的返回值通过形参 result 的形式传入 retryifresultnone 函数中，如果返回值是 None 那么就进行 retry，否则就结束并返回函数值。

在做数据抓取的时候，经常遇到由于网络问题导致的程序保存，先前只是记录了错误内容，并对错误内容进行后期处理。 原先的流程：1. def crawl_page(url): 2.  3.  4.     pass 5.  6.  7.   8.  9.  10. def log_error(url): 11.  12.  13.     pass 14.  15.  16.   17.  18.  19. url = "" 20.  21.  22. try: 23.  24.  25.    crawl_page(url) 26.  27.  28. except: 29.  30.  31.     log_error(url) 改进后的流程：1. attempts = 0 2.  3.  4. success = False 5.  6.  7. while attempts < 3 and not success: 8.  9.  10.     try: 11.  12.  13.         crawl_page(url) 14.  15.  16.         success = True 17.  18.  19.     except: 20.  21.  22.         attempts = 1 23.  24.  25.         if attempts == 3: 26.  27.  28.             break 最近发现的新的解决方案：retryingretrying 是一个 Python 的重试包，可以用来自动重试一些可能运行失败的程序段。retrying 提供一个装饰器函数 retry，被装饰的函数就会在运行失败的条件下重新执行，默认只要一直报错就会不断重试。1. import random 2.  3.  4. from retrying import retry 5.  6.  7.   8.  9.  10. @retry 11.  12.  13. def do_something_unreliable(): 14.  15.  16.     if random.randint(0, 10) > 1: 17.  18.  19.         raise IOError("Broken sauce, everything is hosed!!!111one") 20.  21.  22.     else: 23.  24.  25.         return "Awesome sauce!" 26.  27.  28.   29.  30.  31. print do_something_unreliable() 如果我们运行 haveatry 函数，那么直到 random.randint 返回 5，它才会执行结束，否则会一直重新执行。retry 还可以接受一些参数，这个从源码中 Retrying 类的初始化函数可以看到可选的参数：· stopmaxattempt_number：用来设定最大的尝试次数，超过该次数就停止重试· stopmaxdelay：比如设置成 10000，那么从被装饰的函数开始执行的时间点开始，到函数成功运行结束或者失败报错中止的时间点，只要这段时间超过 10 秒，函数就不会再执行了· wait_fixed：设置在两次 retrying 之间的停留时间· waitrandommin 和 waitrandommax：用随机的方式产生两次 retrying 之间的停留时间· waitexponentialmultiplier 和 waitexponentialmax：以指数的形式产生两次 retrying 之间的停留时间，产生的值为 2^previousattemptnumber * waitexponentialmultiplier，previousattemptnumber 是前面已经 retry 的次数，如果产生的这个值超过了 waitexponentialmax 的大小，那么之后两个 retrying 之间的停留值都为 waitexponentialmax。这个设计迎合了 exponential backoff 算法，可以减轻阻塞的情况。我们可以指定要在出现哪些异常的时候再去 retry，这个要用 retryonexception 传入一个函数对象：1. def retry_if_io_error(exception): 2.  3.  4.     return isinstance(exception, IOError) 5.  6.  7.   8.  9.  10. @retry(retry_on_exception=retry_if_io_error) 11.  12.  13. def read_a_file(): 14.  15.  16.     with open("file", "r") as f: 17.  18.  19.         return f.read() 在执行 readafile 函数的过程中，如果报出异常，那么这个异常会以形参 exception 传入 retryifio_error 函数中，如果 exception 是 IOError 那么就进行 retry，如果不是就停止运行并抛出异常。我们还可以指定要在得到哪些结果的时候去 retry，这个要用 retryonresult 传入一个函数对象：1. def retry_if_result_none(result): 2.  3.  4.     return result is None 5.  6.  7.   8.  9.  10. @retry(retry_on_result=retry_if_result_none) 11.  12.  13. def get_result(): 14.  15.  16.     return None 在执行 getresult 成功后，会将函数的返回值通过形参 result 的形式传入 retryifresultnone 函数中，如果返回值是 None 那么就进行 retry，否则就结束并返回函数值。

关于我们

法律声明

帮助中心

商务合作

相关文章

关于我们

法律声明

帮助中心

商务合作