Я пытаюсь извлечь информацию со страницы сообщества Google Plus. В формате файла json это помогло бы мне проанализировать некоторое социальное поведение.
На самом деле, я попробовал это в браузере Chrome в режиме разработчика, после того, как проанализировал html-структуру страницы сообщества.
Я хотел бы сохранить его в формате, например:
[ {author: "name", post: "post", comments: [{commentator: "cmm", comm: "comment"}]}]
Я пробовал с этим javascript:
// saving all the posts in the posts-array
var posts = document.getElementsByClassName("V2SCpf vCjazd")
var docLength = posts.length
var json = []
// pushing all the text in the json array
for(var i = 0; i < docLength; i++){
json.push(posts[i].innerText)
}
// new array for extracting
var newArray = new Array();
// getting the lines
for (var i = 0; i < json.length; i++) {
newArray[i] = json[i].split('\n');
}
for (var x = 0; x < docLength; x++){
for (var y = 0; y < newArray[x].length; y++){
let n = newArray[x][y]
if(n.length == 0){
continue;
} else {
newArray[x][y]
}
}
}
//looking for my data
newArray
наконец, я получил что-то подобное, когда я использую функцию сохранения:
[
[
"",
"Authors name",
"Discussion",
"",
"",
"2h",
"Comment from author",
"oecd.org",
"no plus ones",
"no comments",
""
Мой вопрос: как я могу привести все эти данные в формат файла json? Спасибо.