Issue 29370984: Fixes 4784 - Improve error reporting in updateMalwareDomainsList and add tests

Issue 29370984: Fixes 4784 - Improve error reporting in updateMalwareDomainsList and add tests (Closed)

Created:
Jan. 10, 2017, 6:08 p.m. by Vasily Kuznetsov

Modified:
Jan. 23, 2017, 9:28 a.m.

Reviewers:
Sebastian Noack, Jon Sonesen

Visibility:
Public.

Description

Fixes 4784 - Improve error reporting in updateMalwareDomainsList and add tests Repository: https://hg.adblockplus.org/sitescripts Base revision: e4f054a8b28b

Patch Set 2 : Close streams more carefully #

Total comments: 4

Patch Set 3 : Improve the error handling flow in try_mirror #

Created: Jan. 20, 2017, 1:43 p.m.

Download [raw] [tar.bz2]

	Unified diffs	Side-by-side diffs	Delta from patch set	Stats (+122 lines, -11 lines)			Patch
M	sitescripts/subscriptions/bin/updateMalwareDomainsList.py	View	1 2	2 chunks	+21 lines, -10 lines	0 comments	Download
A	sitescripts/subscriptions/test/test_updateMalwareDomainsList.py	View	1	1 chunk	+99 lines, -0 lines	0 comments	Download
M	tox.ini	View		1 chunk	+2 lines, -1 line	0 comments	Download

Messages

Total messages: 17

Expand All Messages | Collapse All Messages

Vasily Kuznetsov

https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py File sitescripts/subscriptions/bin/updateMalwareDomainsList.py (left): https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py#oldcode69 sitescripts/subscriptions/bin/updateMalwareDomainsList.py:69: zip = zipfile.ZipFile(StringIO(data), 'r') These three lines are an ...

Jan. 10, 2017, 6:18 p.m. (2017-01-10 18:18:30 UTC) #1

Sebastian Noack

On 2017/01/16 18:38:19, Vasily Kuznetsov wrote: > bump As discussed on IRC, I leave the ...

Jan. 16, 2017, 7:05 p.m. (2017-01-16 19:05:51 UTC) #3

Jon Sonesen

Looks pretty ok, mostly see the comment about using the exception attribute reason as a ...

Jan. 18, 2017, 5:04 p.m. (2017-01-18 17:04:48 UTC) #4

Vasily Kuznetsov

Thanks for the comment, Jon. After looking at it in more detail I think that ...

Jan. 18, 2017, 6:46 p.m. (2017-01-18 18:46:35 UTC) #5

Jon Sonesen

On 2017/01/18 18:46:35, Vasily Kuznetsov wrote: > Thanks for the comment, Jon. After looking at ...

Jan. 19, 2017, 7:49 a.m. (2017-01-19 07:49:52 UTC) #6

Sebastian Noack

https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py File sitescripts/subscriptions/bin/updateMalwareDomainsList.py (right): https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py#newcode40 sitescripts/subscriptions/bin/updateMalwareDomainsList.py:40: url = mirror + MALWAREDOMAINS_PATH This line doesn't seem ...

Jan. 19, 2017, 9:01 a.m. (2017-01-19 09:01:29 UTC) #7

Jon Sonesen

https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py File sitescripts/subscriptions/bin/updateMalwareDomainsList.py (right): https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py#newcode41 sitescripts/subscriptions/bin/updateMalwareDomainsList.py:41: response = urllib2.urlopen(url) On 2017/01/19 09:01:29, Sebastian Noack wrote: ...

Jan. 19, 2017, 9:31 a.m. (2017-01-19 09:31:24 UTC) #8

Jon Sonesen

On 2017/01/19 09:31:24, Jon Sonesen wrote: > https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py > File sitescripts/subscriptions/bin/updateMalwareDomainsList.py (right): > > https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py#newcode41 ...

Jan. 19, 2017, 9:33 a.m. (2017-01-19 09:33:53 UTC) #9

Sebastian Noack

https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py File sitescripts/subscriptions/bin/updateMalwareDomainsList.py (right): https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py#newcode41 sitescripts/subscriptions/bin/updateMalwareDomainsList.py:41: response = urllib2.urlopen(url) On 2017/01/19 09:31:24, Jon Sonesen wrote: ...

Jan. 19, 2017, 9:48 a.m. (2017-01-19 09:48:18 UTC) #11

Jon Sonesen

https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py File sitescripts/subscriptions/bin/updateMalwareDomainsList.py (right): https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py#newcode41 sitescripts/subscriptions/bin/updateMalwareDomainsList.py:41: response = urllib2.urlopen(url) On 2017/01/19 09:48:18, Sebastian Noack wrote: ...

Jan. 19, 2017, 9:55 a.m. (2017-01-19 09:55:01 UTC) #12

https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscri...
File sitescripts/subscriptions/bin/updateMalwareDomainsList.py (right):

https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscri...
sitescripts/subscriptions/bin/updateMalwareDomainsList.py:41: response =
urllib2.urlopen(url)
On 2017/01/19 09:48:18, Sebastian Noack wrote:
> On 2017/01/19 09:31:24, Jon Sonesen wrote:
> > On 2017/01/19 09:01:29, Sebastian Noack wrote:
> > > I think we should explicitly close the response.
> > 
> > Could this be resolved by using a 'with' statement to open it. This way it
> > closes even in the event of an exception?
> 
> Yes, this should be implemented either using try-finally or using a
> with-statement, so that it gets closed no matter what. However, in Python 2,
the
> response returned by urlopen() doesn't implement __enter__/__exit__. So in
order
> to use the with-statement here, the response would have to be wrapped with
> contextlib.closing(). Moreover, if an HTTPError is raised (see below), that
> exception is a file-like object itself, which needs to be closed as well.
> 
> On 2017/01/19 09:33:53, Jon Sonesen wrote:
> > There is also the fact that when the reference count reaches zero for the
> > instance, python's garbage collection will close the connection since
__del__
> is
> > 'self.close()' but I agree that it is best  to explicitly close the
resource.
> 
> Relying on that behavior is bad practice. First of all this is an
implementation
> detail of CPython, and as such it should not be relied on. If possible we
should
> target the Python language, not a specific implementation. More importantly,
> __del__ methods are resolved by the garbage collector in CPython, and
therefore
> closing the response would be indefinitely delayed, so that most likely the
> response will still be open while we already send subsequent requests.

Thanks for elaborating on those points :)

Vasily Kuznetsov

Thanks for all the comments. Now all the streams are carefully closed. https://codereview.adblockplus.org/29370984/diff/29370985/sitescripts/subscriptions/bin/updateMalwareDomainsList.py File sitescripts/subscriptions/bin/updateMalwareDomainsList.py ...

Jan. 19, 2017, 4:34 p.m. (2017-01-19 16:34:08 UTC) #13

Sebastian Noack

https://codereview.adblockplus.org/29370984/diff/29372682/sitescripts/subscriptions/bin/updateMalwareDomainsList.py File sitescripts/subscriptions/bin/updateMalwareDomainsList.py (right): https://codereview.adblockplus.org/29370984/diff/29372682/sitescripts/subscriptions/bin/updateMalwareDomainsList.py#newcode46 sitescripts/subscriptions/bin/updateMalwareDomainsList.py:46: if hasattr(exc, 'close'): On 2017/01/19 16:34:08, Vasily Kuznetsov wrote: ...

Jan. 19, 2017, 5:13 p.m. (2017-01-19 17:13:33 UTC) #14

Vasily Kuznetsov

Jan. 20, 2017, 1:44 p.m. (2017-01-20 13:44:49 UTC) #15

Jon Sonesen

Jan. 20, 2017, 2:17 p.m. (2017-01-20 14:17:53 UTC) #17

On 2017/01/20 14:09:48, Sebastian Noack wrote:
> LGTM

LGTM

Expand All Messages | Collapse All Messages