cms/bin/translate.py - Issue 29317015: Issue 2625 - [cms] Crowdin synchronisation script

Side by Side Diff: cms/bin/translate.py

Issue 29317015: Issue 2625 - [cms] Crowdin synchronisation script (Closed)

Patch Set: Addressed further feedback Created July 11, 2015, 7:17 p.m.

Left:
Right:

Use n/p to move between diff chunks; N/P to move between comments.

Jump to:

View unified diff | Download patch

OLD	NEW
(Empty)
	1 # coding: utf-8

	2

	3 # This file is part of the Adblock Plus web scripts,

	4 # Copyright (C) 2006-2015 Eyeo GmbH

	5 #

	6 # Adblock Plus is free software: you can redistribute it and/or modify

	7 # it under the terms of the GNU General Public License version 3 as

	8 # published by the Free Software Foundation.

	9 #

	10 # Adblock Plus is distributed in the hope that it will be useful,

	11 # but WITHOUT ANY WARRANTY; without even the implied warranty of

	12 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the

	13 # GNU General Public License for more details.

	14 #

	15 # You should have received a copy of the GNU General Public License

	16 # along with Adblock Plus. If not, see <http://www.gnu.org/licenses/>.

	17

	18 import collections

	19 import io

	20 import itertools

	21 import json

	22 import logging

	23 import os

	24 import posixpath

	25 import sys

	26 import zipfile

	27

	28 import urllib3

	29

	30 import cms.utils

	31 from cms.sources import FileSource

	32

	33 logger = logging.getLogger("cms.bin.translate")

	34

	35 class CrowdinAPI:

	36 FILES_PER_REQUEST = 20

	37

	38 def __init__(self, api_key, project_name):

	39 self.api_key = api_key

	40 self.project_name = project_name

	41 self.connection = urllib3.connection_from_url("https://api.crowdin.com/")

	42

	43 def request(self, request_method, api_endpoint, data=None, files=None):

	44 url = "/api/project/%s/%s?key=%s&json=1" % (

	45 self.project_name, api_endpoint, self.api_key

	46 )

	47

	48 fields = []

	49 if data:

	50 for name, value in data.iteritems():

	51 if isinstance(value, basestring):

	52 fields.append((name, value))

	53 else:

	54 fields += [(name + "[]", v) for v in value]

	55 if files:

	56 fields += [("files[%s]" % f[0], f) for f in files]

	57

	58 try:

	59 response = self.connection.request(

	60 request_method, str(url), fields=fields,

	61 timeout=urllib3.Timeout(connect=5)

	62 )

	63 except urllib3.exceptions.HTTPError as e:

	64 logger.error("API call to %s failed:\n%s" % (url, response.data))

	65 raise

	66

	67 if response.status < 200 or response.status >= 300:

	68 logger.error("Connection to API failed for endpoint %s" % url)

	69 raise urllib3.exceptions.HTTPError(response.status, response.data)

	70

	71 try:

	72 return json.loads(response.data)

	73 except ValueError:

	74 logger.error("Invalid response returned by API endpoint %s" % url)

	75 raise

	76

	77

	78 def grouper(iterable, n):

	79 iterator = iter(iterable)

	80 while True:

	81 chunk = tuple(itertools.islice(iterator, n))

	82 if not chunk:

	83 break

	84 yield chunk

	85

	86 def extract_strings(source, defaultlocale):

	87 logger.info("Extracting page strings (please be patient)...")

	88 page_strings = {}

	89

	90 def record_string(page, locale, name, value, comment, fixed_strings):

	91 if locale != defaultlocale:

	92 return

	93

	94 try:

	95 store = page_strings[page]

	96 except KeyError:

	97 store = page_strings[page] = collections.OrderedDict()

	98

	99 store[name] = {"message": value}

	100

	101 if fixed_strings:

	102 comment = comment + "\n" if comment else ""

	103 comment += ", ".join("{%d}: %s" % i_s

	104 for i_s in enumerate(fixed_strings, 1))

	105 if comment:

	106 store[name]["description"] = comment

	107

	108 for page, format in source.list_pages():

	109 cms.utils.process_page(source, defaultlocale, page,

	110 format=format, localized_string_callback=record_strin g)

	111 return page_strings

	112

	113 def configure_locales(crowdin_api, required_locales, enabled_locales,

	114 defaultlocale):

	115 logger.info("Checking which locales are supported by Crowdin...")

	116 response = crowdin_api.request("GET", "supported-languages")

	117

	118 supported_locales = {l["crowdin_code"] for l in response}

	119 skipped_locales = required_locales - supported_locales

	120

	121 if skipped_locales:

	122 logger.warning("Ignoring locales that Crowdin doesn't support: %s" % (

	123 ", ".join(skipped_locales)

	124 ))

	125 required_locales -= skipped_locales

	126

	127 if not required_locales.issubset(enabled_locales):

	128 logger.info("Enabling the required locales for the Crowdin project...")

	129 crowdin_api.request(

	130 "POST", "edit-project",

	131 data={"languages": list(enabled_locales \| required_locales)}

	132 )

	133

	134 return required_locales

	135

	136 def list_remote_files(project_info):

	137 def parse_file_node(node, path=""):

	138 if node["node_type"] == "file":

	139 remote_files.add(path + node["name"])

	140 elif node["node_type"] == "directory":

	141 dir_name = path + node["name"]

	142 remote_directories.add(dir_name)

	143 for file in node.get("files", []):

	144 parse_file_node(file, dir_name + "/")

	145

	146 remote_files = set()

	147 remote_directories = set()

	148 for node in project_info["files"]:

	149 parse_file_node(node)

	150 return remote_files, remote_directories

	151

	152 def list_local_files(page_strings):

	153 local_files = set()

	154 local_directories = set()

	155 for page, strings in page_strings.iteritems():

	156 if strings:

	157 local_files.add(page + ".json")

	158 while "/" in page:

	159 page = page.rsplit("/", 1)[0]

	160 local_directories.add(page)

	161 return local_files, local_directories

	162

	163 def create_directories(crowdin_api, directories):

	164 for directory in directories:

	165 logger.info("Creating directory %s" % directory)

	166 crowdin_api.request("POST", "add-directory", data={"name": directory})

	167

	168 def add_update_files(crowdin_api, api_endpoint, message, files, page_strings):

	169 for group in grouper(files, crowdin_api.FILES_PER_REQUEST):

	170 files = []

	171 for file_name in group:

	172 page = os.path.splitext(file_name)[0]

	173 files.append((file_name, json.dumps(page_strings[page]), "application/json "))

	174 del page_strings[page]

	175 logger.info(message % len(files))

	176 crowdin_api.request("POST", api_endpoint, files=files)

	177

	178 def upload_new_files(crowdin_api, new_files, page_strings):

	179 add_update_files(crowdin_api, "add-file", "Uploading %d new pages...",

	180 new_files, page_strings)

	181

	182 def update_existing_files(crowdin_api, existing_files, page_strings):

	183 add_update_files(crowdin_api, "update-file", "Updating %d existing pages...",

	184 existing_files, page_strings)

	185

	186 def upload_translations(crowdin_api, source_dir, new_files, required_locales):

	187 def open_locale_files(locale, files):

	188 for file_name in files:

	189 path = os.path.join(source_dir, "locales", locale, file_name)

	190 if os.path.isfile(path):

	191 with open(path, "r") as f:

	192 yield (file_name, f.read(), "application/json")

	193

	194 if new_files:

	195 for locale in required_locales:

	196 for files in grouper(open_locale_files(locale, new_files),

	197 crowdin_api.FILES_PER_REQUEST):

	198 logger.info("Uploading %d existing translation "

	199 "files for locale %s..." % (len(files), locale))

	200 crowdin_api.request("POST", "upload-translation", files=files,

	201 data={"language": locale})

	202

	203 def remove_old_files(crowdin_api, old_files):

	204 for file_name in old_files:

	205 logger.info("Removing old file %s" % file_name)

	206 crowdin_api.request("POST", "delete-file", data={"file": file_name})

	207

	208 def remove_old_directories(crowdin_api, old_directories):

	209 for directory in reversed(sorted(old_directories, key=len)):

	210 logger.info("Removing old directory %s" % directory)

	211 crowdin_api.request("POST", "delete-directory", data={"name": directory})

	212

	213 def download_translations(crowdin_api, source_dir, required_locales):

	214 logger.info("Requesting generation of fresh translations archive...")

	215 result = crowdin_api.request("GET", "export")

	216 if result.get("success", {}).get("status") == "skipped":

	217 logger.warning("Archive generation skipped, either "

	218 "no changes or API usage excessive")

	219

	220 logger.info("Downloading translations archive...")

	221 response = crowdin_api.connection.request(

	222 "GET",

	223 "/api/project/%s/download/all.zip?key=%s" % (

	224 crowdin_api.project_name, crowdin_api.api_key

	225 ), preload_content = False

	226 )

	227 if response.status < 200 or response.status >= 300:

	228 raise urllib3.exceptions.HTTPError(response.status, response.data)

	229

	230 logger.info("Extracting translations archive...")

	231 with zipfile.ZipFile(io.BytesIO(response.data), "r") as archive:

	232 locale_path = os.path.join(source_dir, "locales")

	233 # First clear existing translation files

	234 for root, dirs, files in os.walk(locale_path, topdown=True):

	235 if root == locale_path:

	236 dirs[:] = [d for d in dirs if d in required_locales]

	237 for f in files:

	238 if f.endswith(".json"):

	239 os.remove(os.path.join(root, f))

	240 # Then extract the new ones in place

	241 for member in archive.namelist():

	242 path, file_name = posixpath.split(member)

	243 ext = posixpath.splitext(file_name)[1]

	244 locale = path.split(posixpath.sep)[0]

	245 if ext == ".json" and locale in required_locales:

	246 archive.extract(member, locale_path)

	247

	248 def crowdin_sync(source_dir, crowdin_api_key):

	249 with FileSource(source_dir) as source:

	250 config = source.read_config()

	251 defaultlocale = config.get("general", "defaultlocale")

	252 crowdin_project_name = config.get("general", "crowdin-project-name")

	253

	254 crowdin_api = CrowdinAPI(crowdin_api_key, crowdin_project_name)

	255

	256 logger.info("Requesting project information...")

	257 project_info = crowdin_api.request("GET", "info")

	258 page_strings = extract_strings(source, defaultlocale)

	259

	260 required_locales = {l for l in source.list_locales() if l != defaultlocale}

	261 enabled_locales = {l["code"] for l in project_info["languages"]}

	262

	263 required_locales = configure_locales(crowdin_api, required_locales,

	264 enabled_locales, defaultlocale)

	265

	266 remote_files, remote_directories = list_remote_files(project_info)

	267 local_files, local_directories = list_local_files(page_strings)

	268

	269 # Avoid deleting all remote content if there was a problem listing local files

	270 if not local_files:

	271 logger.error("No existing strings found, maybe the project directory is "

	272 "not set up correctly? Aborting!")

	273 sys.exit(1)

	274

	275 new_files = local_files - remote_files

	276 new_directories = local_directories - remote_directories

	277 create_directories(crowdin_api, new_directories)

	278 upload_new_files(crowdin_api, new_files, page_strings)

	279 upload_translations(crowdin_api, source_dir, new_files, required_locales)

	280

	281 existing_files = local_files - new_files

	282 update_existing_files(crowdin_api, existing_files, page_strings)

	283

	284 old_files = remote_files - local_files

	285 old_directories = remote_directories - local_directories

	286 remove_old_files(crowdin_api, old_files)

	287 remove_old_directories(crowdin_api, old_directories)

	288

	289 download_translations(crowdin_api, source_dir, required_locales)

	290 logger.info("Crowdin sync completed.")

	291

	292 if __name__ == "__main__":

	293 if len(sys.argv) < 3:

	294 print >>sys.stderr, "Usage: python -m cms.bin.translate www_directory crowdi n_project_api_key [logging_level]"

	295 sys.exit(1)

	296

	297 logging.basicConfig()

	298 logger.setLevel(sys.argv[3] if len(sys.argv) > 3 else logging.INFO)

	299

	300 source_dir, crowdin_api_key = sys.argv[1:3]

	301 crowdin_sync(source_dir, crowdin_api_key)

OLD	NEW

« no previous file with comments | « README.md ('k') | cms/converters.py » ('j') | no next file with comments »